并且准备进行训练文字转WAV音频