在这期间他自己不停的训练文字转WAV音频