而且还会按照他的引导做出错误的判断文字转WAV音频