所以双方都没有言语文字转WAV音频