然后利用对方来不及反应的时间差文字转WAV音频