Python实现批量识别图片文字并存为Excel

2025-02-23 18:17:35

一、背景

大家好，我是J哥。

也许你还记得，前不久复旦大学一博士生写了130行Python代码，批量识别核酸截图内容的故事。当时还被人民日报公众号报道出来，夸赞用所学贡献青春力量！

其实，批量文字识别（OCR）是Python办公自动化的基本操作，应用在我们工作生活中的方方面面，比如车牌识别、证件识别、银行卡识别、票据识别等等。

Python中OCR第三方库非常多，比如easyocr、PaddleOCR、cnocr等等。当然，直接调用百度API也是可以的，不过超过一定限额后要收费，因此本文主要以开源免费的easyocr来进行介绍。

二、需求

本文以证件识别为例，我网上找了3张虚拟身份证来实验：

运用easyocr进行识别并保存为Excel，效果如下：

三、实战

1.安装模块

在Python中使用 easyocr非常简单，只要使用pip命令安装easyocr 即可（建议使用清华源，否则安装会比较慢）。

pip install easyocr

不过 easyocr 的深度学习算法依赖于另一个著名的第三方模块 pytorch，图形处理部分则会用到 opencv、Pillow 等，所以还需要确保自己电脑上已经安装这些基础模块。

2.识别一张图片

1.easyocr识别图片代码非常简洁，只需要创建一个easyocr.Reader类对象，指定以下两个常用参数：

需要识别的文字属于哪几种语言
是否启用GPU显卡加速

2.调用Reader对象的readtext方法，将图片中所有文字读入一个列表并返回。

'''
公众号：菜J学Python
作者：J哥
'''
# 导入模块
import easyocr
# 图片路径
image = './id_card/1.jpg'
# 创建ocr的reader对象，识别中英文
ocr = easyocr.Reader(['ch_sim', 'en'],gpu=False)
# 识别图片文字
content = ocr.readtext(image)
print(content)

识别结果如下：

[([[39, 31], [207, 31], [207, 67], [39, 67]], '姓名韦小宝', 0.8973890994570185), ([[40, 82], [159, 82], [159, 119], [40, 119]], '性别男', 0.9799311480828728), ([[178, 86], [272, 86], [272, 116], [178, 116]], '民族汉', 0.5456928014755249), ([[40, 131], [100, 131], [100, 161], [40, 161]], '出生', 0.5362269878387451), ([[114, 134], [240, 134], [240, 162], [114, 162]], '1654 年12', 0.6952526392609933), ([[266, 134], [322, 134], [322, 162], [266, 162]], '20日', 0.31329770168285426), ([[42, 181], [395, 181], [395, 213], [42, 213]], '住址北京市东城区景山前街4号', 0.48138251996753667), ([[112, 222], [256, 222], [256, 254], [112, 254]], '紫禁城敬事房', 0.9732440311960702), ([[44, 307], [195, 307], [195, 337], [44, 337]], '公民身份证号码', 0.612808391503521), ([[212, 308], [526, 308], [526, 334], [212, 334]], '112044165412202438', 0.7003081027071493)]

readtext 返回的列表中，每个元素都是一个元组，内含三个信息：位置、文字、置信度。我们可以在调用readtext时指定一个参数 detail=0，从而只返回文字内容。于是修改后代码和效果如下：

import easyocr
image = './id_card/1.jpg'
ocr = easyocr.Reader(['ch_sim', 'en'],gpu=False)
content = ocr.readtext(image,detail=0)
print(content)

['姓名韦小宝', '性别男', '民族汉', '出生', '1654 年12', '20日', '住址北京市东城区景山前街4号', '紫禁城敬事房', '公民身份证号码', '112044165412202438']

3.批量识别图片

批量识别图片无非就是遍历图片文件夹，这里用到了os.listdir()方法以返回文件列表。然后用ocr.readtext()去识别每一张图片文字内容，接着通过字符串切片来获取姓名、性别、民族、出生、住址和身份证号等关键信息，最后统一将这些信息存入列表data中。

'''
公众号：菜J学Python
作者：J哥
'''

import easyocr
import os

# 指明所有图片所在的文件夹
images = './id_card'
# 创建ocr的reader对象，识别中英文
ocr = easyocr.Reader(['ch_sim', 'en'])
# 识别图片文字
content = ocr.readtext(images,detail=0)
# 遍历所有图片并识别文字，切片提取有效信息
data = []
for image in os.listdir(images):
    content = ocr.readtext(f'{images}/{image}', detail=0)
    print(f"正在识别：{image}")
    name = content[0][4:]
    gender = content[1][-1]
    nation = content[2][-1]
    birth = content[-5]
    if "月" not in birth:
        birth = content[-6] + "月" + content[-5]
    if "日" not in birth:
        birth = birth[:-1] + "日"
    address = content[-4][4:] + content[-3]
    number = content[-1]
    print(f"完成识别：{image}")
    print("-" * 50)
    data.append([name, gender, nation, birth, address, number])

4.保存数据

图片文字识别之后，建议通过pandas输出为Excel，方便简洁。

'''
公众号：菜J学Python
作者：J哥
'''

import pandas as pd

# 保存识别结果至Excel
df = pd.DataFrame(data, columns=["姓名", "性别", "民族", "出生", "住址", "身份证号"])
print(f"识别结果如下：")
print(df)
df.to_excel("识别结果.xlsx", index=False)

到此这篇关于Python实现批量识别图片文字并存为Excel的文章就介绍到这了,更多相关Python识别图片文字内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

如何利用Python识别图片中的文字详解

一.Tesseract 文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别.Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别.但是在此之前我们需要完成一个繁琐的工作. (1)Tesseract的安装及配置 Tesseract的安装我们可以移步到该网址 https://digi.bib.uni-mannheim.de/tesseract/,我们可以看到如下界面: 有很多版本供大家选择,大家可以根据自己的需求选择.其中w32表示32
Python基于百度API识别并提取图片中文字

利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字.首先需注册获取 API 调用的 ID 和 key,步骤如下: 打开百度AI开放平台,进入控制台中的文字识别应用(需要有百度账号). 创建一个应用,并进入管理应用,记下 AppID, API Key, Secrect Key,调用 API需用到. 最后安装 python 的百度ai接口的的库 pip install baidu-aip 以下是代码实现,需将所有识别的图片放进名为 picture 的文件夹. #!/usr/
如何利用Python识别图片中的文字

一.前言不知道大家有没有遇到过这样的问题,就是在某个软件或者某个网页里面有一篇文章,你非常喜欢,但是不能复制.或者像百度文档一样,只能复制一部分,这个时候我们就会选择截图保存.但是当我们想用到里面的文字时,还是要一个字一个字打出来.那么我们能不能直接识别图片中的文字呢?答案是肯定的. 二.Tesseract 文字识别是ORC的一部分内容,ORC的意思是光学字符识别,通俗讲就是文字识别.Tesseract是一个用于文字识别的工具,我们结合Python使用可以很快的实现文字识别.但是在此之前我们需
Python图像处理之图片文字识别功能（OCR)

OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制. Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司).Tesseract 是目前公认最优秀.最精确的开源OCR 系统. 除了极高的精确度,Tesseract 也具有很高的灵活性.它可
python利用pytesseract 实现本地识别图片文字

#!/usr/bin/env python3 # -*- coding: utf-8 -*- import glob from os import path import os import pytesseract from PIL import Image from queue import Queue import threading import datetime import cv2 def convertimg(picfile, outdir): '''调整图片大小,对于过大的图片进行
python 识别图片中的文字信息方法

最近朋友需要一个可以识别图片中的文字的程序,以前做过java验证码识别的程序: 刚好最近在做一个python项目,所以顺便用Python练练手 1.需要的环境: 2.7或者3.4版本的python 2.需要安装pytesseract库依赖PIL和tesseract-ocr库本地环境是ubuntu,下面说一下具体步骤: 2.7 1.安装PIL: 直接使用pip 安装: pip install Pillow 2.安装tesseract-ocr: apt-get install tesserac
Python实现批量识别图片文字并存为Excel

目录一.背景二.需求三.实战 1.安装模块 2.识别一张图片 3.批量识别图片 4.保存数据一.背景大家好,我是J哥. 也许你还记得,前不久复旦大学一博士生写了130行Python代码,批量识别核酸截图内容的故事.当时还被人民日报公众号报道出来,夸赞用所学贡献青春力量! 其实,批量文字识别(OCR)是Python办公自动化的基本操作,应用在我们工作生活中的方方面面,比如车牌识别.证件识别.银行卡识别.票据识别等等. Python中OCR第三方库非常多,比如easyocr.PaddleO
python批量识别图片指定区域文字内容

Python批量识别图片指定区域文字内容,供大家参考,具体内容如下简介对于一张图片,需求识别指定区域的内容 1.截取原始图上的指定图片当做模板 2.根据模板相似度去再原始图片上识别准确坐标 3.根据坐标剪切出指定位置图片,也就是所需的内容区域 4.对指定位置图片进行ocr识别环境 Ubuntu18.04 Python2.7 所需Python模块 1.aircv 用于识别模板再原始图的位置坐标 pip install aircv 2.Pillow 用于剪裁图片 pip install Pil
python 利用百度API识别图片文字（多线程版）

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Tue Jun 12 09:37:38 2018 利用百度api实现图片文本识别 @author: XnCSD """ import glob from os import path import os from aip import AipOcr from PIL import Image from queue impor
Python办公自动化之教你用Python批量识别发票并录入到Excel表格中

一.场景描述这里有以四张发票为例(辰哥网上搜的),将发票图片放到pic文件夹下. 随便打开一张发票提取目标:金额.名称.纳税人识别号.开票人. 最后将每一张发票的这四个内容保存到excel中: 二.准备环境需要用到的库如下: from PIL import Image as PI import pyocr import pyocr.builders from cnocr import CnOcr 安装的命令如下: pip install pyocr pip install cnocr 发票
Python实现批量识别银行卡号码以及自动写入Excel表格步骤详解

每当有新员工入职,人事小姐姐都要收集大量的工资卡信息,并且生成Excel文档,看到小姐姐这么辛苦,我就忍不住要去帮她了… 于是我用1行代码就实现了自动识别银行卡信息并且自动生成Excel文件,小姐姐当场就亮眼汪汪的看着我,搞得我都害羞了~ 第一步:识别一张银行卡识别银行卡的代码最简单,只需要1行腾讯云AI的第三方库potencent的代码,如下所示.左右滑动,查看全部. # pip install potencent import potencent # 可以填写本地图片的地址:img_pat
Python实现批量下载图片的方法

本文实例讲述了Python实现批量下载图片的方法.分享给大家供大家参考.具体实现方法如下: #!/usr/bin/env python #-*-coding:utf-8-*-' #Filename:download_file.py import os,sys import re import urllib import urllib2 base_url = 'xxx' array_url = list() pic_url = list() inner_url = list() def get_a
Python实现批量读取图片并存入mongodb数据库的方法示例

本文实例讲述了Python实现批量读取图片并存入mongodb数据库的方法.分享给大家供大家参考,具体如下: 我的图片放在E:\image\中,然后使用python将图片读取然后,显示一张,存入取一张(可以注释掉显示图片的语句),通过Gridfs的方式存入图片.代码如下: # --* coding=utf-8 *-- from cStringIO import StringIO from pymongo import MongoClient import gridfs import os imp
Python实现批量压缩图片

本文为大家分享了Python实现批量压缩图片的具体代码,供大家参考,具体内容如下 # -*- coding: utf-8 -*- """ __author__= 'Du' __creation_time__= '2018/1/5 10:06' """ import os from PIL import Image import glob DIR = 'C:/Users/Public/Pictures/Sample Pictures/' class
Python实现批量修改图片格式和大小的方法【opencv库与PIL库】

本文实例讲述了Python实现批量修改图片格式和大小的方法.分享给大家供大家参考,具体如下: 第一种方法用到opencv库 import os import time import cv2 def alter(path,object): result = [] s = os.listdir(path) count = 1 for i in s: document = os.path.join(path,i) img = cv2.imread(document) img = cv2.resize(