然后一次次的回放叠加文字转WAV音频