也就是控制了整个虚拟世界文字转WAV音频