所以他建议由自己带着文字转WAV音频