同时询问出声文字转WAV音频