他可以基本判断出文字转WAV音频