在安泽开口回答之前文字转WAV音频