只剩下基础的框架文字转WAV音频