起码要有一定的模糊语言判断能力文字转WAV音频