只是以反问的方式进行确认文字转WAV音频