但是一方面我们又要确保稳定文字转WAV音频