再加上他们所看到的景象文字转WAV音频