那么他们就应该相互信任文字转WAV音频