所以他很轻松地听到了两人的对话文字转WAV音频