1、在使用pytesseract打开图片是遇到错误,没有找到文件
pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it’s not in your PATH
2、排查解决:
在我们下载了PIL(命令pip install pillow)后,找到pytesseract.py文件,里面的tesseract_cmd =’tesseract’,这里并没有指定文件路径
3、直接在pycharm中安装tesseract-cor失败
4、从网上找到相应的‘Tesseract-OCR’下载安装(寻找对应版本):
地址:https://github.com/tesseract-ocr/tesseract/wiki
Windows为例:
点击Tesseract at UB Mannheim
找到符合自己电脑的下载
5、下载完后安装Tesseract-OCR
选择自己安装的目录(要添加到环境变量里面去),一直下一步就完成了
6、添加到环境变量的系统变量(PATH)去
7、增加一个TESSDATA_PREFIX变量名,变量值还是我的安装路径C:\Program Files\Tesseract-OCR\tessdata这是将语言字库文件夹添加到变量中;
8、打开终端,输入:tesseract -v,可以看到版本信息
9、在pytesseract库下的pytesseract.py文件中找到tesseract_cmd = ‘tesseract’,修改成 tesseract_cmd =r’C:\Program Files\Tesseract-OCR\tesseract.exe’
(刚才安装的路径下)
10、再去运行程序
可以简单识别验证码,没有报错了
作者:小邝小邝
链接:https://www.jianshu.com/p/93ab58dea50f
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。