他也要进行自己的训练文字转WAV音频