所以他还是使用了最直接的办法文字转WAV音频