其余四个场景模板进行的都是好好的文字转WAV音频