python3安装OCR识别库tesserocr过程图解

2025-04-09 13:15:40

OCR简介

OCR，即Optical Character Recognition，光学字符识别，是指通过扫描字符，然后通过其形状将其翻译成电子文本的过程，对应图形验证码来说，它们都是一些不规则的字符，这些字符是由字符稍加扭曲变换得到的内容，我们可以使用OCR技术来讲其转化为电子文本，然后将结果提取交给服务器，便可以达到自动识别验证码的过程。

window环境

环境材料准备

Window10
Python-3.7.3.tgz
tesserocr安装包

安装tesserocr

1、打开链接，https://digi.bib.uni-mannheim.de/tesseract/，见下图。

下载最新版的tesseract-ocr-w64-setup-v5.0.0.20190623.exe，然后安装，本人直接安装在C盘目录下。安装完毕后，如下图。

配置环境变量，有两个步骤。

在系统变量里，修改path，如下图。

在系统变量里，创建一个新的变量名为:TESSDATA_PREFIX，值为:C:\Program Files\Tesseract-OCR\tessdata(根据自己安装的tesserocr安装路径为准)，如下图。

检查Tesseract-OCR是否安装完成，如下图。

Python3.7加载tesserocr

1、安装Python的OCR识别库

pip install Pillow
pip install pytesseract

2、python加载Window的tesserocr应用，要修改pytesseract三方库的pytesseract.py脚本。

打开pytesseract.py，将Window的tesserocr应用的tesserocr.exe绑定好。

3、到这里Python的绑定window的tesserocr应用已经完成。

读取验证码图片

from PIL import Image
import pytesseract

def read_text(text_path):
  """
  传入文本(jpg、png)的绝对路径,读取文本
  :param text_path:
  :return: 文本内容
  """
  # 验证码图片转字符串
  im = Image.open(text_path)
  # 转化为8bit的黑白图片
  imgry = im.convert('L')
  # 二值化，采用阈值分割算法，threshold为分割点
  threshold = 140
  table = []
  for j in range(256):
    if j < threshold:
      table.append(0)
    else:
      table.append(1)
  out = imgry.point(table, '1')
  # 识别文本
  text = pytesseract.image_to_string(out, lang="eng", config='--psm 6')
  return text

if __name__ == '__main__':
  print(read_text("d://v3.png"))

输出：

读取中文文本图片

1、因为OCR读取不同语言需要加载语言包，因此需要下载简体中文语言包。
从这个链接下载:https://github.com/tesseract-ocr/tessdata,下载红圈的简体中文包。然后将此文件放置window的安装目录下。如下两个图。

现在，我们来读取如下图片的中文文本内容。

代码如下:

from PIL import Image
import pytesseract

def read_text(text_path):
  """
  传入文本(jpg、png)的绝对路径,读取文本
  :param text_path:
  :return: 文本内容
  """
  # 验证码图片转字符串
  im = Image.open(text_path)
  # 转化为8bit的黑白图片
  imgry = im.convert('L')
  # 二值化，采用阈值分割算法，threshold为分割点
  threshold = 140
  table = []
  for j in range(256):
    if j < threshold:
      table.append(0)
    else:
      table.append(1)
  out = imgry.point(table, '1')
  # 识别文本，lang参数改为chi_sim，其他代码与上面的读取验证码代码一致。
  text = pytesseract.image_to_string(out, lang="chi_sim", config='--psm 6')
  return text
if __name__ == '__main__':
  print(read_text("d://v7.png"))

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

如何使用Python进行OCR识别图片中的文字

朋友需要一个工具,将图片中的文字提取出来.我帮他在网上找了一些OCR的应用,都不好用.所以准备自己研究,写一个Web APP供他使用. OCR1,全称Optical character recognition,或者optical character reader,中文译名叫做光学文字识别.它是把图像文件中的手写文本,打印文本转换为机器编码文本的一种方法. OCR技术广泛用于识别打印纸张中的文字数据 -- 比如护照,支票,银行声明,收据,统计表单,邮件等.OCR的早期版本,需要对图片中的每个文字都
详解Python安装tesserocr遇到的各种问题及解决办法

Tesseract的安装及配置在Python爬虫过程中,难免遇到各种各样的验证码问题,最简单的就是这种验证码了,那么在遇到验证码的时候该怎么办呢?我们就需要OCR技术了,OCR-即Optical Character Recognition光学字符识别,是指通过扫描字符,然后将其形状翻译成电子文本的过程.而tesserocr是Python的一个OCR识别库,所以在安装tesserocr之前,我们需要安装tesseract这个东西下载地址:https://digi.bib.uni-mannhe
Python图像处理之图片文字识别功能（OCR)

OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制. Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司).Tesseract 是目前公认最优秀.最精确的开源OCR 系统. 除了极高的精确度,Tesseract 也具有很高的灵活性.它可
Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解

百度OCR体验地址: https://ai.baidu.com/tech/imagerecognition/general 腾讯OCR体验地址: https://cloud.tencent.com/act/event/ocrdemo 测试结果是:腾讯的效果要比百度的好腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月百度接口调用之前写过文章 python实现百度OCR图片识别过程解析使用步骤 1.注册账号: https://cloud.tenc
python实现百度OCR图片识别过程解析

这篇文章主要介绍了python实现百度OCR图片识别过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下代码如下 import base64 import requests class CodeDemo: def __init__(self,AK,SK,code_url,img_path): self.AK=AK self.SK=SK self.code_url=code_url self.img_path=img_path self.ac
python3光学字符识别模块tesserocr与pytesseract的使用详解

OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程,对应图形验证码来说,它们都是一些不规则的字符,这些字符是由字符稍加扭曲变换得到的内容,我们可以使用OCR技术来讲其转化为电子文本,然后将结果提取交给服务器,便可以达到自动识别验证码的过程 tesserocr与pytesseract是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,pytesseract是Goog
Python识别快递条形码及Tesseract-OCR使用详解

识别快递单号这次跟老师做项目,这项目大概是流水线上识别快递上的快递单号.首先我尝试了解条形码的基本知识百度百科:条形码条形码(barcode)是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符.常见的条形码是由反射率相差很大的黑条(简称条)和白条(简称空)排成的平行线图案.条形码可以标出物品的生产国.制造厂家.商品名称.生产日期.图书分类号.邮件起止地点.类别.日期等许多信息,因而在商品流通.图书管理.邮政管理.银行系统等许多领域都得到广泛的应用. 条形码有
win10安装tesserocr配置 Python使用tesserocr识别字母数字验证码

链接:https://pan.baidu.com/s/1l2yiba7ZTPUTf41ZnJ4PYw 提取码:t3bq win10安装tesserocr 首先需要下载tesseract,它为tesserocr提供底层支持.具体下载官方路径:https://github.com/UB-Mannheim/tesseract/wiki,选择对应的系统版本,可以选择一个相对不带dev的稳定版本下载,如:tesseract-ocr-setup-3.05.02-20180621.exe.然后一路安装,唯一记
python3安装OCR识别库tesserocr过程图解

OCR简介 OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程,对应图形验证码来说,它们都是一些不规则的字符,这些字符是由字符稍加扭曲变换得到的内容,我们可以使用OCR技术来讲其转化为电子文本,然后将结果提取交给服务器,便可以达到自动识别验证码的过程. window环境环境材料准备 Window10 Python-3.7.3.tgz tesserocr安装包安装tesserocr 1.打开链接,http
Pyqt助手安装PyQt5帮助文档过程图解

一.个人安装环境 1.Windows10x64_pro 2.anaconda4.6.9 +python3.7.1(anaconda集成,不需单独安装) 4.PyQt5 二.安装Qt帮助文档 2.1 官方下载链接 https://pypi.org/project/PyQtdoc/ 个人选择amd64版本 2.2 安装下载完成后安装,一路Next,不在给出安装截图. 注意: 下载安装包存放本地,请不要包含中文路径请记住PyQtdoc安装路径,下文需要使用,要是找不到路径就尴尬了! 三.导入Qt助
win10下python3.8的PIL库安装过程

1.找到Python的位置我的是在 C:\Users\admin\AppData\Local\Programs\Python\Python38 AppData这个文件是个隐藏文件需要查询得先把隐藏文件显示出来 win10里面在Microsoft store 下载的Python我只找到了exe文件,所以就卸载然后重新下载过. 去官网下载的时候下载速度极其慢,可以去这下: https://python123.io/download 2.PIL库的安装 PIL库:具有强大的图像处理能力在上面找到的
Python免费验证码识别之ddddocr识别OCR自动库实现

目录安装过程: 完成之后,找个参考图片附ddddocr-验证码识别案例总结需要ocr识别,推荐一个Python免费的验证码识别-ddddocr 安装过程: 1.镜像安装:pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple pip install ddddocr -i https://pypi.tuna.tsinghua.edu.cn/simple 2.python.exe -m pip install --upg
Linux下安装python3.6和第三方库的教程详解

Linux下安装Python3.6和第三方库如果本机安装了python2,尽量不要管他,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境, 比如yum!!!!! 不要动现有的python2环境! 一.安装python3.6 1. 安装依赖环境 # yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdb
Python安装whl文件过程图解

这篇文章主要介绍了Python安装whl文件过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下在命令指示符下(cmd)的Python3安装命令为: pip3 install 文件名.whl 安装出错: matplotlib-2.0.0-cp34-cp34m-win_amd64.whl is not a supported wheel on this platform. 原来是万能仓库的包名除了问题,将包的名字改一下就好: matplotl
全网最详细的PyCharm+Anaconda的安装过程图解

一.下载安装包 1.安装网址 https://www.jetbrains.com/pycharm/ 2.在导航栏输入网址回车 3.点击 DOWNLOAD. 4.下载它有专业版和社区版,我们下载社区版就可以使用了.(专业版要收费) 二.安装过程 5.双击安装包. 6.点击next 7.安装位置它会有一个默认的安装位置,一般默认C盘,但我们可以点击 Browse... ,安装我们想要安装的位置,我安装在了D盘.如下图: 8.安装选择数字1:create desktop shortcut(创建桌
Java+Tomcat 环境部署及安装过程图解

下面在Centos7进行安装Java+Tomcat,网上的很多文章,我在部署中都有些问题,下面是我自己总结的一个安装过程! 安装Java环境首先,我们先到Java官网下载JDK 这里我下载jdk1.8版本的 https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 点击 Accept License Agreement 选择好版本进行下载,需要注册Oracle账户登陆下载! 将下载的
MySql 5.7.17压缩包免安装的配置过程图解

MySQL数据库管理软件有两种版本,一种是企业版,一种是社区版,其中,前者是收费的,如果是个人使用的,社区版足矣.下载mysql-5.7.17-winx64.zip,并将之解压于自己选定的目录后,如图1,会在文件夹里看到配置文件my-default.ini,此时,需将其复制,并粘贴进bin文件夹里,并将其重新命名为my.ini,如图2.至此准备工作完成,下面将详说具体的配置过程. 工具/原料 (1)电脑:Lenovo B460e: (2)操作系统:windows 7,64位: (3)mysq
Python3.7安装keras和TensorFlow的教程图解

win10 Python3.7安装keras深度学习集成包 TensorFlow 和Ubuntu下安装keras 在win10下安装安装时必须检查你的python是否为64位,32位不支持!!! 32 位卸载下载其中的64位在python官网 https://www.python.org/downloads/windows/ 然后在 pip install --upgrade tensorflow 如果出现错误可以手动选择下载然后安装对于3.7以上版本更适合 https://www.lfd.

python3安装OCR识别库tesserocr过程图解

相关推荐

随机推荐