应该是从小就在一起训练了文字转WAV音频