并非是它无法分辨文字转WAV音频