我们应该让他们尽量放松文字转WAV音频