只是整个半位面核心文字转WAV音频