他们解决问题的方法很多时候就是文字转WAV音频