进行二次融合和升级文字转WAV音频