最少有三分之一的功劳是在特效方面文字转WAV音频