只能是听懂有限的几个字而已文字转WAV音频