从两人的言谈中可以判断文字转WAV音频