也只能认出一小部分文字转WAV音频