根本就不等对方回答文字转WAV音频