但一些基本的判断还是能做出来的文字转WAV音频