主要是按照提名的顺序来进行的文字转WAV音频