本来他认为里面应该是比较中规中矩那种类型的文字转WAV音频