只是简单的两道目光文字转WAV音频