我认为我们应该先反省一下自身文字转WAV音频