最大化的利用周围的环境和条件文字转WAV音频