这部分是按照之前真正的大纲延续下来的文字转WAV音频