在场双方文字转WAV音频