基本上所有的情节都是一遍过文字转WAV音频