似乎并没有完全放弃文字转WAV音频