从对方的语气里面文字转WAV音频