python pytesseract库的实例用法

说明

1、pytesseract需要与安装在本地的tesseract-ocr.exe文件一起使用。

2、需要注意的是,安装时必须选择中文包,默认只支持英文识别。

安装命令

pip install pytesseract

实例

import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open(r"d:\Desktop\39DEE621-40EA-4ad1-90CC-79EB51D39347.png"))
print(text)

识别结果输出

Using Tesseract OCR with Python
# import the necessary packages
from PIL import Image
import pytesseract
import ergperse
import cv2
import os

# construct the argument parse and parse the arguments
ap = argparse.ArgunentParser()
ap.add_argument("-i", "--image", required-True,
help="path to input image to be OCR'd")
ap.add_argument("-p", "--preprocess", typesstr, default="thresh",
helpe"type of preprocessing to be done")
args = vars (ap.parse_args())

实例扩展:

Python使用pytesseract库识别图片文字

准备

首先需在本机安装Tesseract客户端,然后安装pytesseract库:

pip install pytesseract

没安装过PIL的也要安装一下,因为所调用的第一个参数是由Image类返回:

pip install PILLOW

实例

import pytesseract
from PIL import Image

img = Image.open("D://aa.jpg")
text = pytesseract.image_to_string(img, lang="chi_sim")
print(text)

到此这篇关于python pytesseract库的实例用法的文章就介绍到这了,更多相关python pytesseract库是什么内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python pytesseract验证码识别库用法解析

    环境 centos7 python3 pytesseract只是tesseract-ocr的一种实现接口.所以要先安装tesseract-ocr(大名鼎鼎的开源的OCR识别引擎). 依赖安装 yum install-y automake autoconf libtool gcc gcc-c++ yum install-y libpng-devel libjpeg-devel libtiff-devel giflib-devel 安装依赖的leptonica库 wget http://www.le

  • python下调用pytesseract识别某网站验证码的实现方法

    一.pytesseract介绍 1.pytesseract说明 pytesseract最新版本0.1.6,网址:https://pypi.python.org/pypi/pytesseract Python-tesseract is a wrapper for google's Tesseract-OCR ( http://code.google.com/p/tesseract-ocr/ ). It is also useful as a stand-alone invocation scrip

  • python利用pytesseract 实现本地识别图片文字

    #!/usr/bin/env python3 # -*- coding: utf-8 -*- import glob from os import path import os import pytesseract from PIL import Image from queue import Queue import threading import datetime import cv2 def convertimg(picfile, outdir): '''调整图片大小,对于过大的图片进行

  • python3光学字符识别模块tesserocr与pytesseract的使用详解

    OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程,对应图形验证码来说,它们都是一些不规则的字符,这些字符是由字符稍加扭曲变换得到的内容,我们可以使用OCR技术来讲其转化为电子文本,然后将结果提取交给服务器,便可以达到自动识别验证码的过程 tesserocr与pytesseract是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,pytesseract是Goog

  • python opencv pytesseract 验证码识别的实现

    一.环境配置 需要 pillow 和 pytesseract 这两个库,pip install 安装就好了. install pillow -i http://pypi.douban.com/simple --trusted-host pypi.douban.com pip install pytesseract -i http://pypi.douban.com/simple --trusted-host pypi.douban.com 安装好Tesseract-OCR.exe pytesse

  • python3使用Pillow、tesseract-ocr与pytesseract模块的图片识别的方法

    1.安装Pillow pip install Pillow 2.安装tesseract-ocr github地址: https://github.com/tesseract-ocr/tesseract 或本地下载地址:https://www.jb51.net/softs/538925.html windows: The latest installer can be downloaded here: tesseract-ocr-setup-3.05.01.exe and tesseract-oc

  • Python基于内置库pytesseract实现图片验证码识别功能

    这篇文章主要介绍了Python基于内置库pytesseract实现图片验证码识别功能,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 环境准备: 1.安装Tesseract模块 git文档地址:https://digi.bib.uni-mannheim.de/tesseract/ 下载后就是一个exe安装包,直接右击安装即可,安装完成之后,配置一下环境变量,编辑 系统变量里面 path,添加下面的安装路径: 2.如果您想使用其他语言,请下载相应的

  • python pytesseract库的实例用法

    说明 1.pytesseract需要与安装在本地的tesseract-ocr.exe文件一起使用. 2.需要注意的是,安装时必须选择中文包,默认只支持英文识别. 安装命令 pip install pytesseract 实例 import pytesseract from PIL import Image text = pytesseract.image_to_string(Image.open(r"d:\Desktop\39DEE621-40EA-4ad1-90CC-79EB51D39347.

  • python中reload重载实例用法

    当我们想对python中原有的模块进行覆盖,又不希望退出当前的程序,就需要用到重载的概念.这样既能使模块得到更新,又不影响解释器的使用.在导入的模块上,也是对之前原有模块的一次覆盖,包括最初导入时所加载的各种过程.下面我们学习reload的一些基础内容,在实例中体会加载功能. 1.装载MyModule语法演示: from imp import reload reload(MyModule) 2.参数 module -- 模块对象. 3.返回值 返回模块对象. 4.实例 当前目录下有一个test.

  • python中similarity函数实例用法

    1.similarity函数接收两个列表,并返回由两个列表中相同元素组成的列表. 2.函数使用列表推导,遍历所有a列表中的元素,并使用in关键词来判断这些元素是否存在于b列表中. 实例 def similarity(a, b): return [item for item in a if item in b] # EXAMPLES similarity([1, 2, 3], [1, 2, 4]) # [1, 2] 知识点扩充: python 语义similarity_Python:string的

  • Python面向对象之类和实例用法分析

    本文实例讲述了Python面向对象之类和实例用法.分享给大家供大家参考,具体如下: 类 虽然 Python 是解释性语言,但是它是面向对象的,能够进行对象编程.至于何为面向对象,在此就不详说了.面向对象程序设计本身就很值得深入学习,如要了解,请参阅网上其他的资料. 面向对象最重要的概念就是类(Class)和实例(Instance),牢记 类 是抽象的模板,比如Student类,而实例是根据类创建出来的一个个具体的"对象",每个对象都拥有相同的方法,但各自的数据可能不同. 以Studen

  • python numpy库np.percentile用法说明

    在python中计算一个多维数组的任意百分比分位数,此处的百分位是从小到大排列,只需用np.percentile即可-- a = range(1,101) #求取a数列第90%分位的数值 np.percentile(a, 90) Out[5]: 90.10000000000001 a = range(101,1,-1) #百分位是从小到大排列 np.percentile(a, 90) Out[7]: 91.10000000000001 详看官方文档 numpy.percentile Parame

  • python的setattr函数实例用法

    现在小编已经学习语言程序良久,但是在了解以后,如果让小编再去学习语言要入手入口,一定是先从掌握函数开始了解,原因很简单,任何一个代码串都是有函数构成的,这就好比我们在打游戏的时候,先掌握"w"."Q"键一样,这样才能灵活运用整个程序的良好运转.又给大家带来一个好用的函数--setattr. 步骤1.描述 setattr 函数对应函数 getatt(),用于设置属性值,该属性必须存在. 步骤2.setattr 语法 setattr(object, name, valu

  • python中pdb模块实例用法

    大家可能都不大熟悉关于pdb这个模块,实际上就是python中的内置模块,主要作用于命令行调试代码,下面我们将通过是哪个小结给大家详细介绍下使用该内容的方式,首先是简单介绍,然后为大家呈现实例,最后就是总结啦,小伙伴是不是相当期待呢,那就板正做好,一起来详细了解下吧~ 简单介绍: 添加断点-代码后添加一行 pdb.set_trace() 命令行添加断点 b line_number 常见命令: 进入命令行Debug模式,python -m pdb xxx.py h:(help)帮助 w:(wher

  • python中time.ctime()实例用法

    在对于时间准确度的把握上,为了使操作的更加细化,很多人习惯把时间精确到秒.但在实际程序操作中,虽然秒数方便我们的查阅,但是计算机并不能直接的识别,所以还需要借助time.ctime()函数转换成字符串的形式.下面我们就time.ctime()的说明.语法.参数.返回值分别介绍,最后分享代码实例. 1.说明 该函数把时间秒数转为字符串. 2.语法 time.ctime([ sec ]) 3.参数 sec -- 要转换为字符串时间的秒数. 4.返回值 该函数没有任何返回值. 5.实例 //连续每隔1

  • python匿名函数的实例用法

    一般情况下,lambda就像是一个函数简化器,它允许在所用代码中嵌入函数的定义.它们完全是可选的(一直都可以使用def替换它们),但只需嵌入少量可执行代码,就能使代码结构更加简洁,从而大大简化代码复杂性,提高代码可读性. 1.优点 (1)减少重复代码: (2)模块化代码. 2.实例 # def函数 def square(x): return x**2 squared = map(square, [1, 2, 3, 4, 5]) # lambda函数 squared = map(lambda x:

  • python if三元表达式实例用法详解

    1.说明 使用一行代码快速判断,更换复杂的多行if语句,使代码能够简单地维护. if三元表达式的阅读方式有点不符合阅读习惯.从句子中间的if条件开始读,条件满足的话,得到左侧的值x,条件不满足的话,得到else下面的值x. 2.实例 result = x if x > 0 else -x >>> x = -15 >>> x if x > 0 else -x 15 知识点扩展: public class java { public static void ma

随机推荐