需要的会是之前的所有的总和还要多文字转WAV音频