是一个三维到四维的低级世界文字转WAV音频