如果真的按照原着的架构方式去制作电影文字转WAV音频