提出了一个替代的方案文字转WAV音频