Python调用百度AI实现图片上表格识别功能

2025-03-31 07:40:52

简介

Python免费调用百度AI实现图片上面的表格识别

步骤

安装百度AI库

!pip install baidu-aip

注册百度AI开放平台

先注册百度AI，获得ID和密钥。注册方法可参考：注册方法只需走到 “1.6 获取密钥” 即可。然后记录下自己的APP_ID、API_KEY、SECRET_KEY，就可以开始了。

调用AipOcr库识别表格文字

from aip import AipOcr #导入AipOcr模块，用于做文字识别

APP_ID = '*********' # 你申请的
API_KEY = '*********'# 你申请的
SECRET_KEY = '*********'# 你申请的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

选择的图片为某化学方程式表（来源于网络）

以二进制方式打开图片，读取：

file = "表格图片\\化学方程式表.jpg"
pic = open(file,'rb') #以二进制方式打开图片
img = pic.read() #读取
table = client.tableRecognitionAsync(img)    #调用表格识别模块
print(table)

然后调用表格识别模块tableRecognitionAsync()，并将返回值存入变量table中并查看：

table是一个字典，其中有2个键，一个叫result，一个叫log_id。我们需要的是result中的request_id,可以通过如下语句获取：

request_id = table['result'][0]['request_id']
request_id

通过这个ID，可以获取识别完成后所保存的Excel表格的下载地址。将request_id传入getTableRecognitionResult()就能获取结果。

result = client.getTableRecognitionResult(request_id)
print(result)

打印一下结果result，就能看到下面的内容。其中result_data对应的那个网址就是Excel表格的下载地址。

调用webbrowser库使用webbrowser.open(url)语句自动打开网址进行下载：

url = result['result']['result_data']

import webbrowser # 打开浏览器
webbrowser.open(url)

附：Python 通过浏览器打开指定网址

1.通过默认浏览器打开网页

import webbrowser
webbrowser.open("http://www.baidu.com")

　webbrowser.open(url, new=0, autoraise=True) 在系统的默认浏览器中访问url地址，如果new=0, url会在同一个

浏览器窗口中打开；如果new=1，新的浏览器窗口会被打开;new=2 新的浏览器tab会被打开

2.通过os模块,启动浏览器并打开指定网页

import os
os.system('"C:\Program Files\internet explorer\iexplore.exe" http://www.baidu.com')

3.使用selenium

from selenium import webdriver
url='http://www.baidu.com'
driver = webdriver.Firefox()
driver.get(url)

识别结果如下:

这个Excel文件有6张工作表，具体包含与图片中表格内容的对应关系如下。body储存表格部分的内容，header储存表头的文字，footer储存表尾的文字。

识别效果并非完美，但是整体看来还行，当然，原稿越清晰，识别效果越好。

可能遇到的问题

在开始前，需要检查图片的大小，必须在1K~4M之间，不然会报错“‘error_msg': ‘image size error, image is too big or too small, upper limit 4M, lower limit 1k, please check your param'”。

批量操作

先获取所有图片的路径，存入pictures列表。结果如下。

#获取路径下所有图片文件，并存入列表
import os
work_path = "表格图片\\"
pictures=[] # 存储文件夹内所有文件的路径（包括子目录内的文件）
for root, dirs, files in os.walk(work_path):
    path = [os.path.join(root, name) for name in files]
    pictures.extend(path)
pictures

然后将所有图片逐个传入表格识别接口，获取其请求ID及存有识别结果的Excel文件的下载地址。在提取Excel下载路径之前，需要先判断识别是否完成。这是通过识别结果返回的字典中的'ret_msg'对应的值来判断的。只有当它是“已完成”时，才能获得下载链接。此处用了while循环，每隔2秒刷新一下状态，直到状态是“已完成”时，才提取链接。然后使用requests.get()获取下载链接信息，写入Excel文件。Excel自动命名及下载结果如图。

from aip import AipOcr  #导入AipOcr模块，用于做文字识别
import time #时间模块
import requests #用于HTTP请求

APP_ID = '24800359' # 你申请的
API_KEY = 'PrmTtmrqkeaqhvxOPEN4eZVt'# 你申请的
SECRET_KEY = 'LOFpCH6wpLV7xZPG0DTcvV4x1Sqyvmk9'# 你申请的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

#提交识别请求，并储存所有请求ID
for picture in pictures:
    pic = open(picture,'rb') #以二进制方式打开图片
    img = pic.read() #读取
    table = client.tableRecognitionAsync(img)    #调用表格识别模块
    request_id = table['result'][0]['request_id']

    #判断识别是否完成，直到完成才根据请求ID获取Excel下载路径
    result = client.getTableRecognitionResult(request_id)  #通过ID获取识别结果
    while result['result']['ret_msg'] != '已完成': #如果状态是“已完成”，才能获取下载地址
        time.sleep(2) #暂停2秒再刷新
        result = client.getTableRecognitionResult(request_id) #持续刷新，直到满足条件

    download_path = result['result']['result_data']

    #下载并将Excel文件名设为图片名
    excel_name = picture.split(".")[0] + ".xls" #让excel文件的名字与图片相同
    excel = requests.get(download_path) #抓取下载链接
    file = open(excel_name, 'wb') #新建excel文件
    file.write(excel.content) #写入excel文件并保存

总结

到此这篇关于Python调用百度AI实现图片上表格识别功能的文章就介绍到这了,更多相关Python调用百度AI识别表格内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python利用百度AI实现文字识别功能

本文为大家分享了python实现文字识别功能大全,供大家参考,具体内容如下 1.通用文字识别 # -*- coding: UTF-8 -*- from aip import AipOcr # 定义常量 APP_ID = '11352343' API_KEY = 'Nd5Z1NkGoLDvHwBnD2bFLpCE' SECRET_KEY = 'A9FsnnPj1Ys2Gof70SNgYo23hKOIK8Os' # 初始化AipFace对象 aipOcr = AipOcr(APP_ID, API_K
Python3调用百度AI识别图片中的文字功能示例【测试可用】

本文实例讲述了Python3调用百度AI识别图片中的文字功能.分享给大家供大家参考,具体如下: 首先pip install命令安装baidu-aip模块,如下图所示(这里使用pip3 install baidu-aip命令): 编辑Python代码时注意,需要首先引入AipOcr和re两个模块,即: from aip import AipOcr import re 示例代码如下: from aip import AipOcr import re APP_ID='***' API_KEY='***
python 百度aip实现文字识别的实现示例

目录介绍模块使用介绍百度aip模块是用于实现百度云与用户接口,简单来说就是使用百度云所拥有的人工智能模块. 模块使用 pip install baidu-aip#下载百度云模块登录百度云账号填写信息使用官方的文档 https://cloud.baidu.com/doc/OCR/s/wkibizyjk #百度aip模块,实现文字识别 from aip import AipOcr """ 你的 APPID AK SK """ APP_I
Python调用百度AI实现图片上文字识别功能实例

目录简介步骤安装百度AI库注册百度AI开放平台调用glob库调用AipOcr库识别文字可能会遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的文字识别步骤安装百度AI库 !pip install baidu-aip 注册百度AI开放平台先注册百度AI,获得ID和密钥.注册方法可参考:注册方法只需走到 "1.6 获取密钥" 即可.然后记录下自己的APP_ID.API_KEY.SECRET_KEY,就可以开始了. 调用glob库 glob库用
python 使用百度AI接口进行人脸对比的步骤

1. 注册百度云账号注册百度智能云,提交申请. 创建应用获取AppID,API Key,Secret Key. 2. 安装baidu python api 人脸对比 API 文档 pip install baidu-aip 调用: import base64 from aip import AipFace APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipFace(APP_I
Python基于百度AI实现OCR文字识别

百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量快速安装:执行pip install baidu-aip即可新建一个AipOcr: from aip import AipOcr """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Ap
python调用百度AI接口实现人流量统计

百度AI接口的调用方法不必多介绍. 官网地址人流量统计新建AipBodyAnalysis from aip import AipBodyAnalysis """ 你的 APPID AK SK """ APP_ID = '你的 App ID' API_KEY = '你的 Api Key' SECRET_KEY = '你的 Secret Key' client = AipBodyAnalysis(APP_ID, API_KEY, SECRET_K
Python基于百度AI实现抓取表情包

本文先抓取网络上的表情图像,然后利用百度 AI 识别表情包上的说明文字,并利用表情文字重命名文件,这样当发表情包时,不需要逐个打开查找,直接根据文件名选择表情并发送. 一.百度 AI 开放平台的 Key 申请方法本例使用了百度 AI 的 API 接口实现文字识别.因此需要先申请对应的 API 使用权限,具体步骤如下: 在网页浏览器(比如 Chrome 或者火狐) 的地址栏中输入 ai.baidu.com,进入到百度云 AI 的官网,在该页面中单击右上角的控制台按钮. 进入到百度云 AI 官
Python基于百度AI的文字识别的示例

使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以自行传入一张带有文字的图片,进行识别. 下载baidu-aip这个库,可以直接使用pip下载:pip install baidu-aip,也可以在PyCharm等开发工具中下载. 然后运行下列代码即可. # -*- coding: UTF-8 -*- from aip import AipOcr import json # 定义常量 APP_ID = '9851066' API_KEY = 'LUGBatgyRGoe
Python调用百度AI实现图片上表格识别功能

目录简介步骤安装百度AI库注册百度AI开放平台调用AipOcr库识别表格文字可能遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的表格识别步骤安装百度AI库 !pip install baidu-aip 注册百度AI开放平台先注册百度AI,获得ID和密钥.注册方法可参考:注册方法只需走到 "1.6 获取密钥" 即可.然后记录下自己的APP_ID.API_KEY.SECRET_KEY,就可以开始了. 调用AipOcr库识别表格文字 from
Python调用百度OCR实现图片文字识别的示例代码

百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '******' API_KEY = '************' SECRET_KEY = '**************' 下面就是百度API包的安装,在终端cmd输入如下语句直接pip方式安装,注意是 baidu-api 哦! pip install --user baidu-aip 接下来上py
Python调用百度AI实现颜值评分功能

目录一.调用百度接口进行人脸属性识别二.根据年龄和性别对颜值进行评价三.批量识别人脸属性四.自定义窗口语音播报颜值得分五.明星颜值评价一.调用百度接口进行人脸属性识别安装好baidu-aip模块,获取了百度AI接口密钥后,即可调用百度接口进行人脸属性识别了.首先以杨紫的图片为例进行年龄.性别.颜值的识别. 具体python代码如下:‍ import os import base64 from aip import AipFace os.chdir(r'F:\公众号\28.人脸识别'
Python调用百度AI实现身份证识别

目录一.安装baidu-aip模块二.获取百度AI接口密钥三.调用百度接口识别身份证一.安装baidu-aip模块按win+R打开cmd,在里面输入 pip3 install baidu-aip 若出现如下界面,即成功安装了baidu-aip模块: 如果想快速了解识别营业执照代码原理,可以跳过第二部分,先看第三部分的内容. 二.获取百度AI接口密钥在应用python识别身份证的过程中,有三行代码使用了百度AI接口密钥,故先阐述如何获得该密钥.首先,进入如下百度AI官方网站:https
Python调用百度AI实现人像分割详解

目录一.原始视频截图二.提取人像三.和背景图合并四.合成视频一.原始视频截图 import cv2 cap=cv2.VideoCapture(r"[小仙若]shake it !冬日也要活力满满! (P1. shake it).mp4") ret,frame=cap.read() i =0 timeF=3 j=0 num=0 while 1: i=i+1 if (i%timeF==0): j=j+1 cv2.imwrite("./pictures/"+str
python调用百度语音识别实现大音频文件语音识别功能

本文为大家分享了python实现大音频文件语音识别功能的具体代码,供大家参考,具体内容如下实现思路:先用ffmpeg将其他非wav格式的音频转换为wav格式,并转换音频的声道(百度支持声道为1),采样率(值为8000),格式转换完成后,再用ffmpeg将音频切成百度. 支持的时长(30秒和60秒2种,本程序用的是30秒). # coding: utf-8 import json import time import base64 from inc import rtysdb import ur