顶多就是纠正一下孩子们的动作文字转WAV音频