拍摄出来的照片根本无法分辨上面的人文字转WAV音频