然后从对方的言语中找到更多的线索文字转WAV音频