尽量减少初期的投入文字转WAV音频