应该直接推倒重建文字转WAV音频