这里面主要是有丁长生的因素在里面文字转WAV音频