然后又重新汇聚在一起文字转WAV音频