他们两个说话的时候旁边的人听不懂文字转WAV音频