我们要辩证地看文字转WAV音频