Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解

2025-03-29 11:25:08

百度OCR体验地址：

https://ai.baidu.com/tech/imagerecognition/general

腾讯OCR体验地址：

https://cloud.tencent.com/act/event/ocrdemo

测试结果是：腾讯的效果要比百度的好

腾讯云目前额度是：

每个接口 1,000次/月免费，有6个文字识别的接口，一共是6,000次/月

百度接口调用之前写过文章

python实现百度OCR图片识别过程解析

使用步骤

1、注册账号： https://cloud.tencent.com/

2、开通服务：https://console.cloud.tencent.com/ocr/general

3、申请访问秘钥：https://console.cloud.tencent.com/cam/capi

4、通过 API 或 SDK 或命令行来使用服务

具体参考《操作指南》：https://cloud.tencent.com/document/product/866/17622

接口使用

1、安装SDK

https://github.com/TencentCloud/tencentcloud-sdk-python

pip3 install tencentcloud-sdk-python

2、代码实例

# -*- coding: utf-8 -*-

import json

from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.ocr.v20181119 import ocr_client
from tencentcloud.ocr.v20181119.models import (
  GeneralAccurateOCRRequest,
  EnglishOCRRequest,
  GeneralBasicOCRRequest,
  GeneralEfficientOCRRequest,
  GeneralFastOCRRequest,
  GeneralHandwritingOCRRequest
)

class TencentOcr(object):
  """
  计费说明：1,000次/月免费
  https://cloud.tencent.com/document/product/866/17619
  """
  SECRET_ID = "你的秘钥 SECRET_ID"

  SECRET_KEY = "你的秘钥 SECRET_KEY"

	# 地域列表
	# https://cloud.tencent.com/document/api/866/33518#.E5.9C.B0.E5.9F.9F.E5.88.97.E8.A1.A8
  Region = "ap-beijing"

  endpoint = "ocr.tencentcloudapi.com"

  # 通用文字识别相关接口
  # https://cloud.tencent.com/document/api/866/37173
  mapping = {
    # 通用印刷体识别（高精度版） ok
    "GeneralAccurateOCR": GeneralAccurateOCRRequest,

    # 英文识别 ok
    "EnglishOCR": EnglishOCRRequest,

    # 通用印刷体识别 一般
    "GeneralBasicOCR": GeneralBasicOCRRequest,

    # 通用印刷体识别（精简版）（免费公测版）no
    "GeneralEfficientOCR": GeneralEfficientOCRRequest,

    # 通用印刷体识别（高速版）一般
    "GeneralFastOCR": GeneralFastOCRRequest,

    # 通用手写体识别 ok
    "GeneralHandwritingOCR": GeneralHandwritingOCRRequest,

  }

  def __init__(self):
    cred = credential.Credential(self.SECRET_ID, self.SECRET_KEY)

    httpProfile = HttpProfile()
    httpProfile.endpoint = self.endpoint

    clientProfile = ClientProfile()
    clientProfile.httpProfile = httpProfile
    self.client = ocr_client.OcrClient(cred, self.Region, clientProfile)

  def get_image_text(self, image_url, ocr="GeneralAccurateOCR"):
    req = self.mapping[ocr]()
    req.ImageUrl = image_url
    resp = getattr(self.client, ocr)(req)
    return json.loads(resp.to_json_string())['TextDetections'][0]['DetectedText']

def main():
  tencentOcr = TencentOcr()
  url = "https://ocr-demo-1254418846.cos.ap-guangzhou.myqcloud.com/general/GeneralBasicOCR/GeneralBasicOCR3.jpg"
  print(tencentOcr.get_image_text(url, ocr="GeneralHandwritingOCR"))

if __name__ == '__main__':
  main()

更多关于Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例请查看下面的相关链接

Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解

百度OCR体验地址: https://ai.baidu.com/tech/imagerecognition/general 腾讯OCR体验地址: https://cloud.tencent.com/act/event/ocrdemo 测试结果是:腾讯的效果要比百度的好腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月百度接口调用之前写过文章 python实现百度OCR图片识别过程解析使用步骤 1.注册账号: https://cloud.tenc
Python图像处理之图片文字识别功能（OCR)

OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几个底层OCR 库,或者是在上面进行定制. Tesseract 是一个OCR 库,目前由Google 赞助(Google 也是一家以OCR 和机器学习技术闻名于世的公司).Tesseract 是目前公认最优秀.最精确的开源OCR 系统. 除了极高的精确度,Tesseract 也具有很高的灵活性.它可
Python将文字转成语音并读出来的实例详解

前言本篇文章主要介绍,如何利用Python来实现将文字转成语音.将文字转成语音主要有两种不同的实现方法:先将文字转成语音,然后再通过读取语音实现发音.直接调用系统内置的语音引擎实现发音,后一种方法的实现主要利用第三方库. 环境 Python版本:Anaconda 4.4.10 操作系统:win10 注意:在使用第三方库的时候,不同的操作系统和Python版本代码可能有所差别. 调用api 可以调用第三方的语音合成api生成音频文件,然后再播放音频文件即可,这里我使用的是百度语音合成api. 1
Python完全识别验证码自动登录实例详解

1.直接贴代码 #!C:/Python27 #coding=utf-8 from selenium import webdriver from selenium.webdriver.common.keys import Keys from pytesser import * from PIL import Image,ImageEnhance,ImageFilter from selenium.common.exceptions import NoSuchElementException,Tim
ThinkPHP 在阿里云上的nginx.config配置实例详解

具体代码如下所示: # For more information on configuration, see: # * Official English Documentation: http://nginx.org/en/docs/ # * Official Russian Documentation: http://nginx.org/ru/docs/ user nginx; worker_processes auto; error_log /var/log/nginx/error.log;
Hibernate识别数据库特有字段实例详解

Hibernate识别数据库特有字段实例详解前言: Hibernate已经为绝大多数常用的数据库数据类型提供了内置支持,但对于某些数据库的专属字段支持就不够好了. 这些特殊数据类型往往提供了比常规数据类型更好的数据表达能力,更符合我们的业务场景.比如PostgreSQL的Interval类型,可以非常方便的保存一个时间段的数据. 本文以添加Interval类型支持为例,说明为Hibernate添加特有数据类型支持的方法. Hibernate提供了丰富的数据类型支持,但对于部分数据库专有的数据类
Android6.0指纹识别开发实例详解

Android6.0指纹识别开发实例详解最近在做android指纹相关的功能,谷歌在android6.0及以上版本对指纹识别进行了官方支持.当时在FingerprintManager和FingerprintManagerCompat这两个之间纠结,其中使用FingerprintManager要引入com.android.support:appcompat-v7包,考虑到包的大小,决定使用v4兼容包FingerprintManagerCompat来实现. 主要实现的工具类FingerprintU
微信扫码支付零云插件版实例详解

微信扫码支付零云插件版实例详解微信的扫码支付主要有以下过程: 向微信统一下单地址发送详细的订单信息,微信返回json数据,里面包含生成二维码的字段,使用生成二维码的插件qrcode生成二维码返回给前端,让用户扫码完成支付,然后页面跳转到return_url告知用户支付成功,微信服务器正式通知支付成功之后修改数据库数据. //Pay类下的主要方法 public function buildRequestForm($pay_data){ $UNIFIED_ORDER_URL = 'weixin:/
Python3 处理JSON的实例详解

Python3 处理JSON的实例详解真的好简单,灰常简单 import os, io, sys, re, time, base64, json import webbrowser, urllib.request def main(): "main function" url = "http://m.weather.com.cn/data/101010100.html" stdout=urllib.request.urlopen(url) weatherInfo=
修改Android FloatingActionButton的title的文字颜色及背景颜色实例详解

修改Android FloatingActionButton的title的文字颜色及背景颜色实例详解首先看一张图片我是在一个不错的开源的FloatingActionButton库基础上实现的,链接github开源库参考图片的标记和代码里的注释.代码如下: <com.getbase.floatingactionbutton.FloatingActionsMenu android:id="@+id/fab_meau" android:layout_width="wra

Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解

使用步骤

接口使用

2、代码实例

相关推荐

随机推荐