从对方的口气中能够听出文字转WAV音频