首先是被传递在了一面光镜里面文字转WAV音频