然后进行统一规划和重建文字转WAV音频