Python实现识别图片内容的方法分析

2025-03-30 20:27:32

本文实例讲述了Python实现识别图片内容的方法。分享给大家供大家参考，具体如下：

python识别图片内容。

这里我的环境为windows64位，python2.7.14

需要用到PIL模块和tesseract模块。

首先需要安装pip包管理，安装方法可参考附录windows下安装python包管理器pip

安装PIL模块：

pip install Pillow

tesseract模块安装：

pip install pytesseract

安装识别引擎和中文语言包，点击此处本站下载。

下载完成解压：

1.双击tesseract-ocr-setup-3.02.02.exe安装，安装完成后，需要指定tesseract模块识别引擎的程序路径，打开python安装路径的模块路径，我的路径为：E:\wamp\python\Lib\site-packages\，进入pytesseract，编辑pytesseract.py文件，修改 tesseract_cmd = 'tesseract' 的内容：

# tesseract_cmd = 'tesseract' # 修改为安装Tesseract-OCR的真实路径
tesseract_cmd = 'E:/wamp/python modules/Tesseract-OCR/tesseract.exe'

2.进入解压包中的中文语言包，复制chi_sim.traineddata到Tesseract-OCR安装目录下tessdata文件夹下，我的路径：E:\wamp\python modules\Tesseract-OCR\tessdata\chi_sim.traineddata

环境配置完成。

python代码：

# -*- coding: UTF-8 -*-
from PIL import Image
import pytesseract
# 识别中文
text = pytesseract.image_to_string(Image.open('chinese.png'),lang='chi_sim')
print text
# 识别英文
text = pytesseract.image_to_string(Image.open('english.png'))
print text

附：windows下安装python包管理器pip

windows下安装python包管理器pip。

pip下载地址：https://pypi.python.org/pypi/pip#downloads

选择 pip-9.0.1.tar.gz (md5, pgp)

下载完成解压，这里我解压到D:\python\pip-9.0.1，命令行进入D:\python\pip-9.0.1

cd D:\python\pip-9.0.1

安装pip

python setup.py install

安装完成，输入pip list查看是否成功

pip list

显示下面信息代表安装成功：

pip (9.0.1)
setuptools (28.8.0)

pip安装模块命令：

pip install xxx

更多关于Python相关内容可查看本站专题：《Python数学运算技巧总结》、《Python图片操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程》

希望本文所述对大家Python程序设计有所帮助。

python 识别图片中的文字信息方法

最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序: 刚好最近在做一个python项目,所以顺便用Python练练手 1.需要的环境: 2.7或者3.4版本的python 2.需要安装pytesseract库依赖PIL和tesseract-ocr库本地环境是ubuntu,下面说一下具体步骤: 2.7 1.安装PIL: 直接使用pip 安装: pip install Pillow 2.安装tesseract-ocr: apt-get install tesserac
利用Python实现简单的相似图片搜索的教程

大概五年前吧,我那时还在为一家约会网站做开发工作.他们是早期创业公司,但他们也开始拥有了一些稳定用户量.不像其他约会网站,这家公司向来以洁身自好为主要市场形象.它不是一个供你鬼混的网站--是让你能找到忠实伴侣的地方. 由于投入了数以百万计的风险资本(在US大萧条之前),他们关于真爱并找寻灵魂伴侣的在线广告势如破竹.Forbes(福布斯,美国著名财经杂志)采访了他们.全国性电视节目也对他们进行了专访.早期的成功促成了事业起步时让人垂涎的指数级增长现象--他们的用户数量以每月加倍的速度增长.对他们而
Python+Opencv识别两张相似图片

在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话题作为计算机科学的一个分支,不可能就在本文简单几句就说清,所以本文只作基本算法的科普向. 看到一篇博客是介绍这个,但他用的是PIL中的Image实现的,感觉比较麻烦,于是利用Opencv库进行了更简洁化的实现. 相关背景要识别两张相似图像,我们从感性上来谈是怎么样的一个过程?首先我们会区分这两张相片的类型,例如是风景照,还是人物照.风景照中
python实现识别相似图片小结

文章简介在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话题作为计算机科学的一个分支,不可能就在本文简单几句就说清,所以本文只作基本算法的科普向. 如有错误,请多包涵和多多指教. 参考的文章和图片来源会在底部一一列出. 以及本篇文章所用的代码都会在底下给出github地址. 安装相关库 python用作图像处理的相关库主要有openCV(C++编写,提供了python语言的接口),PIL,
Python2比较当前图片跟图库哪个图片相似的方法示例

本文实例讲述了Python2比较当前图片跟图库哪个图片相似的方法.分享给大家供大家参考,具体如下: # -*- coding: utf-8 -*- ''' Created on 2019年7月22日 ''' from selenium import webdriver from time import sleep from PIL import Image import random import os import cv2 import numpy as np url ="URL"
Python实现图片滑动式验证识别方法

1 abstract 验证码作为一种自然人的机器人的判别工具,被广泛的用于各种防止程序做自动化的场景中.传统的字符型验证安全性已经名存实亡的情况下,各种新型的验证码如雨后春笋般涌现.目前最常见的一种形式就是"滑动拼图式" 2 内容概述关于滑动式验证,最早由国内某网络安全公司首次提出的行为式验证,以滑动拼图解锁的方式呈现在世人面前.然后大概过了好几年之后,各种各样的滑动式验证产品都出来了,那么这些看似一样的产品,它们的安全性到底如何呢? 本文特意挑选出了一些后来者的小厂商的滑动式验证来
python好玩的项目—色情图片识别代码分享

一.实验简介本实验将使用 Python3 去识别图片是否为色情图片,我们会使用到 PIL 这个图像处理库,会编写算法来划分图像的皮肤区域 1.1. 知识点 Python 3 的模块的安装 Python 3 基础知识肤色像素检测与皮肤区域划分算法 Pillow模块的使用 argparse 模块的使用 1.2. 效果展示二.实验步骤 2.1. 安装包 PIL 2009年之后就没有更新了,也不支持 Python3 ,于是有了 Alex Clark 领导的公益项目 Pillow,Pillow 是一
基于python3 OpenCV3实现静态图片人脸识别

本文采用OpenCV3和Python3 来实现静态图片的人脸识别,采用的是Haar文件级联. 首先需要将OpenCV3源代码中找到data文件夹下面的haarcascades文件夹里面包含了所有的OpenCV的人脸检测的XML文件,这些文件可以用于检测静态,视频文件,摄像头视频流中的人脸,找到haarcascades文件夹后,复制里面的XML文件,在你新建的Python脚本文件目录里面建一个名为cascades的文件夹,并把复制的XML文件粘贴到新建的文件夹中一些有人脸的的图片,这个大家可以自行
Python编程实现的图片识别功能示例

本文实例讲述了Python编程实现的图片识别功能.分享给大家供大家参考,具体如下: 1. 安装PIL,官方没有WIN64位,Pillow替代 pip install Pillow-2.7.0-cp27-none-win_amd64.whl 2. 安装Pytesser 下载pytesser_v0.0.1.zip,解压后复制进Python27\Lib\site-packges\pytesser路径下,无pytesser则新建在Python27\Lib\site-packges\pytesser中新
如何使用Python进行OCR识别图片中的文字

朋友需要一个工具,将图片中的文字提取出来.我帮他在网上找了一些OCR的应用,都不好用.所以准备自己研究,写一个Web APP供他使用. OCR1,全称Optical character recognition,或者optical character reader,中文译名叫做光学文字识别.它是把图像文件中的手写文本,打印文本转换为机器编码文本的一种方法. OCR技术广泛用于识别打印纸张中的文字数据 -- 比如护照,支票,银行声明,收据,统计表单,邮件等.OCR的早期版本,需要对图片中的每个文字都
Python比较两个图片相似度的方法

本文实例讲述了Python比较两个图片相似度的方法.分享给大家供大家参考.具体分析如下: 这段代码实用pil模块比较两个图片的相似度,根据实际实用,代码虽短但效果不错,还是非常靠谱的,前提是图片要大一些,太小的图片不好比较.附件提供完整测试代码和对比用的图片. 复制代码代码如下: #!/usr/bin/python # Filename: histsimilar.py # -*- coding: utf-8 -*- import Image def make_regalur_image(img

Python实现识别图片内容的方法分析

相关推荐

随机推荐