然后再次适应环境文字转WAV音频