Python调用百度AI实现图片上文字识别功能实例

2025-04-14 18:03:38

简介

Python免费调用百度AI实现图片上面的文字识别

步骤

安装百度AI库

!pip install baidu-aip

注册百度AI开放平台

先注册百度AI，获得ID和密钥。注册方法可参考：注册方法只需走到 “1.6 获取密钥” 即可。然后记录下自己的APP_ID、API_KEY、SECRET_KEY，就可以开始了。

调用glob库

glob库用于获得指定路径下的指定后缀的文件，图片使用的是《数学模型》pdf扫描版，部分如下：

import glob
path = "数学模型\\"
glob.glob(path+"*.png")

指定文件夹中的指定的.png后缀的文件，全部提取出来了：

选取第一张图片 “数学模型1.png” 做测试：

files = glob.glob(path+"*.png")
file = files[0]

调用AipOcr库识别文字

导入AipOcr模块，这个模块是用于做文字识别的（OCR即Optical Character Recognition，光学字符识别）。填入你申请的ID和KEY，client = AipOcr()是固定写法。先用二进制方式rb打开，然后读取，再调用百度AI进行识别，并将识别结果存入message变量。

from aip import AipOcr #导入AipOcr模块，用于做文字识别
import glob

APP_ID = '*********' # 你申请的
API_KEY = '*********'# 你申请的
SECRET_KEY = '*********'# 你申请的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

pic = open(file,'rb')# 以二进制（rb）打开
img = pic.read() # 读取
message = client.basicGeneral(img) # 调用百度AI识别图片中的文字

查看message参数，结果如下：

可见，message参数的结果为 “大字典” 形式，其中的键 words_result 所对应的值为一个 “大列表” ，这个列表里又有很多键值对，键都是words，值就是AI从图片上识别出来的内容。使用语句message['words_result'][0...n]['words']可以筛选出该页的标题：

message['words_result'][1]['words']

for循环逐行提取:

for words in message['words_result']:
    word = words['words'] # 提取文字
    print(word)

识别效果图：

识别也不是完美的，有很多识别错误与未识别出的文字。当然，原图字体越清晰，识别度越高。

可能会遇到的问题

识别过程中可能会遇到类似识别错误（无法识别）问题，原因是未领取免费识别次数，解决过程如下：

百度OCR API识别失败：Open api qps request limit reached 错误解决方法

几个月前，用Python写了个小工具，主要是用到了百度的OCR API做了个文字识别的小工具，前面一直能用，然而今天，在使用的时候，报错了。
错误如下：Open api qps request limit reached

最后终于找到了解决方法，原来，现在要自己去领取免费的测试额度了！！！

领取免费测试额度的地址：（或者你在你原来那个调用的那个项目里也可以找到免费领取测试额度，见下图）

https://console.bce.baidu.com/ai/#/ai/ocr/overview/resource/getFree

领取完之后，还是用原来项目的appID,apiKey,secretKey即可。

然后等领取额度到账后，重新运行就行了。

批量操作

批量操作的核心为for循环,txt_file = open('数学模型.txt', 'a')指打开名字为“数学模型”的文本文件（若不存在则自动新建），模式为添加模式，即'a'模式。添加模式是指，如果文本中已经有一些内容，则接着往下写，不会影响原来的内容。如果是'w'模式，则会将之前的内容全部覆盖。然后遍历待处理的图片，逐个处理：

from aip import AipOcr #导入AipOcr模块，用于做文字识别
import glob

APP_ID = '*********' # 你申请的
API_KEY = '*********'# 你申请的
SECRET_KEY = '*********'# 你申请的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

path = "数学模型\\"
files = glob.glob(path+"*.png")

txt_file = open('数学模型.txt', 'a')

for file in files:
    pic = open(file,'rb')# 以二进制（rb）打开
    img = pic.read() # 读取
    message = client.basicGeneral(img) # 调用百度AI识别图片中的文字
    for words in message['words_result']:
        word = words['words'] # 提取文字
        print(word)

        txt_file.write(word) # 将文字写入文本文件

txt_file.close() # 关闭文本文件

总结

到此这篇关于Python调用百度AI实现图片上文字识别功能的文章就介绍到这了,更多相关Python图片上文字识别内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python 利用百度API识别图片文字（多线程版）

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Tue Jun 12 09:37:38 2018 利用百度api实现图片文本识别 @author: XnCSD """ import glob from os import path import os from aip import AipOcr from PIL import Image from queue impor
Python基于百度AI的文字识别的示例

使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以自行传入一张带有文字的图片,进行识别. 下载baidu-aip这个库,可以直接使用pip下载:pip install baidu-aip,也可以在PyCharm等开发工具中下载. 然后运行下列代码即可. # -*- coding: UTF-8 -*- from aip import AipOcr import json # 定义常量 APP_ID = '9851066' API_KEY = 'LUGBatgyRGoe
python使用百度文字识别功能方法详解

介绍python使用百度智能去的文字识别功能,可以识别截图中的文,登陆路验证码等等., 登陆百度智能云,选择产品服务. 选择"人工智能"---文字识别. 点击创建应用. 如图下面有关于"文字识别"的各类信息,如通用文字识别每天可以名费使用50000次,文字识别高精度版本免费使用500次每天.对于一般应用应该还足够. 在创建应用界面填入必要的信息,点击"立即创建"按纽.返回后点击"管理应用"按纽. 管理应用界面主要是能看到调用接
Python基于百度API识别并提取图片中文字

利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字.首先需注册获取 API 调用的 ID 和 key,步骤如下: 打开百度AI开放平台,进入控制台中的文字识别应用(需要有百度账号). 创建一个应用,并进入管理应用,记下 AppID, API Key, Secrect Key,调用 API需用到. 最后安装 python 的百度ai接口的的库 pip install baidu-aip 以下是代码实现,需将所有识别的图片放进名为 picture 的文件夹. #!/usr/
Python调用百度OCR实现图片文字识别的示例代码

百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '******' API_KEY = '************' SECRET_KEY = '**************' 下面就是百度API包的安装,在终端cmd输入如下语句直接pip方式安装,注意是 baidu-api 哦! pip install --user baidu-aip 接下来上py
Python3调用百度AI识别图片中的文字功能示例【测试可用】

本文实例讲述了Python3调用百度AI识别图片中的文字功能.分享给大家供大家参考,具体如下: 首先pip install命令安装baidu-aip模块,如下图所示(这里使用pip3 install baidu-aip命令): 编辑Python代码时注意,需要首先引入AipOcr和re两个模块,即: from aip import AipOcr import re 示例代码如下: from aip import AipOcr import re APP_ID='***' API_KEY='***
python利用百度AI实现文字识别功能

本文为大家分享了python实现文字识别功能大全,供大家参考,具体内容如下 1.通用文字识别 # -*- coding: UTF-8 -*- from aip import AipOcr # 定义常量 APP_ID = '11352343' API_KEY = 'Nd5Z1NkGoLDvHwBnD2bFLpCE' SECRET_KEY = 'A9FsnnPj1Ys2Gof70SNgYo23hKOIK8Os' # 初始化AipFace对象 aipOcr = AipOcr(APP_ID, API_K
python 3调用百度OCR API实现剪贴板文字识别

本程序调用百度OCR API对剪贴板的图片文字识别,配合CaptureScreen软件,可快速识别文字. #!python3 import urllib.request, urllib.parse import os, io, sys, json, socket import base64 from PIL import ImageGrab socket.setdefaulttimeout(30) def get_auth(): apikey = 'your apikey' secret_key
Python基于百度云文字识别API

本文实例为大家分享了Python实现最简单的文字识别的具体代码,供大家参考,具体内容如下 Python版本:3.6.5 百度云提供的文字识别技术,准确率还是非常高的,而且每天还有5w次免费的调用量,对于用来学习或者偶尔拿来用用,已经完全足够了.文章提供一个模板,稍加修改就可以直接套用.注释中提到必须输入的地方,你都正确地输入了的话,就可以完成一次简单的文字识别了. # -*- coding: utf-8 -*- import requests import base64 class Orc_ma
Python基于百度AI实现OCR文字识别

百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量快速安装:执行pip install baidu-aip即可新建一个AipOcr: from aip import AipOcr """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Ap