只有对方应声文字转WAV音频