也就是空间维度进行探索文字转WAV音频