他们还同时将目光文字转WAV音频