然后用询问的目光文字转WAV音频