所以这训练就得以展开文字转WAV音频