另外一个因素也就是你刚才说的文字转WAV音频