PaddleOCR 识别表情包文字示例详解

2025-02-17 05:34:04

引言

最近在做个表情包的小程序，涉及到表情包搜索功能。我们上传表情包的时候，只有一张图，怎么搜索？这个时候我们想到就是将表情包的文字提取出来，作为搜索的内容。那么这就需要用到 ocr 技术了。

经过几个 ocr 的库的使用，小编强烈推荐使用 PaddleOCR，一款文本识别效果不输于商用的Python库！

对于 PaddleOCR 本文不会过多介绍，可自行搜索。重点是如何使用 PaddleOCR 解决我的问题。

安装 PaddleOCR

pip install paddlepaddle
pip install paddleocr

我这边安装后的版本：

paddleocr==2.5.0.3
paddlepaddle==2.3.1

在 macOS 安装后，项目运行报错报错，忘了截图，应该是与 setuptools 版本有关，解决方式：

pip install --upgrade setuptools==59.8.0

完成这些配置后，我们就可以愉快的玩耍了。

本地处理

import hashlib
import io
from PIL import Image
from paddleocr import PaddleOCR
def get_gif_pic_path(url):
    '''下载图片，返回图片第一帧路径'''
    response = requests.get(url)
    filename = hashlib.md5(url.encode(encoding='utf-8')).hexdigest()
    img = Image.open(io.BytesIO(response.content))
    current = img.tell()
    img_path = f'bqb/{filename}_{current}.png'
    img.save(img_path)
    return img_path
def ocr_get_gif_text_sec(url) -> str:
    '''识别gif第一帧图片的文字'''
    img_path = get_gif_pic_path(url)
    ocr = PaddleOCR(use_angle_cls=True, lang='ch')
    result = ocr.ocr(img_path, cls=True)
    data = []
    for item in result:
        data.append(item[1][0])
    return ",".join(data)
ocr_get_gif_text_sec('https://xxxxxx')

由于 gif 是个动图，所以我们需要取出图片的第一帧进行识别，get_gif_pic_path实现了这个功能。ocr_get_gif_text_sec 从 gif 第一帧的图进行文字提取，返回的 result 是个数组，我们通过遍历进行提取出来。

提取 gif 图片的内容我们就完成了，两个函数的功能也比较简单。本文没做 gif 全部文字的提取，有兴趣可以挑战下。

在 flask 中处理

当我们想在上传图片的时候，进行对图片文字的处理怎么办？难道要将上传的图保存到路径再去识别么？这也是我在开发中遇到的一个问题，经过拆坑，答案是：不，你不需要。

思路：我们可以从表单中获取上传的图片的二进制，然后将这个二进制传给ocr.ocr()，那么ocr.ocr() 支持这个类型么？经过查看此函数源码，我们可以让它支持。

将图片二进制转化为 nparray 类型即可。下面是这个过程的具体代码

from paddleocr import PaddleOCR
import numpy as np
import cv2
@app.route('/v1/upload_img', methods=['POST'])
def api_v1_upload_img():
    if 'file' not in request.files:
        return "no file part"
    file = request.files['file']
    if file.filename == '':
        return "no selected file"
    if file:
        file_name = file.filename
        # 获取图片的二进制
        res = upload_image(bytes=file.read(), filename=file_name)
        return res
    else:
        return "no file"
def upload_image(bytes, filename = None, mime_type = None):
    ocr = PaddleOCR(use_angle_cls=True, lang="ch")
    ## 核心步骤
    np_arr = np.frombuffer(bytes, dtype=np.uint8)
    img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)
    # 进行识别
    result = ocr.ocr(img=img, cls=True)
    ocr_result = []
    for line in result:
        ocr_result.append(line[1][0].strip())
    img_content = ' '.join(ocr_result)
    return img_content

在api_v1_upload_img我们获取到图片二进制以及图片名，将这些作为参数传到upload_image，在upload_image中：

np_arr = np.frombuffer(bytes, dtype=np.uint8)
img = cv2.imdecode(np_arr, cv2.IMREAD_COLOR)

上面两行代码是这个需求的核心突破点。

还有一点就是建议不要将此识别功能部署到性能差的机器上，并发一下，完全扛不住，默默的留下两行眼泪。

以上就是PaddleOCR 识别表情包文字示例详解的详细内容，更多关于PaddleOCR识别表情包文字的资料请关注我们其它相关文章！

windows+vscode安装paddleOCR运行环境的步骤

因为最近在做文本检测相关,想试着用用百度的paddle框架. 1.安装Anaconda3 官网下载安装包直接运行安装,然后新建python3.7环境 2.安装paddle相关环境参考官网地址: https://www.paddlepaddle.org.cn/install/quick/zh/1.8.5-windows-pip https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/installation.md 里面第
python3.7中安装paddleocr及paddlepaddle包的多种方法

升级pip pip版本必须升级到20.0.4版本才能应用: 方法一.在pycharm中对pip进行升级: 方法二.通过命令进行升级 python3.7 -m pip install --upgrade pip 下载paddleOCR 下载链接:https://github.com/PaddlePaddle/PaddleOCR 打开paddleOCR文件夹中requirements.txt文件,更改文件中opencv-python为opencv-python == 4.2.0.32,因为支持pad
Python利用PaddleOCR制作个搜题小工具

目录介绍安装安装PaddlePaddle飞桨框架安装PaddleOCR 代码使用搜题小工具安装ADB 截图并保存题目区域图片 OCR识别,获取题目打开浏览器搜索完整代码介绍 PaddleOCR 是一个基于百度飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别.竖排文本识别.长文本识别.同时支持多种文本检测.文本识别的训练算法. 本教程将介绍PaddleOCR的基本使用方法以及如何使用它开发一个自动搜题的小工具. 项目地址 OR 安装虽然
Python 图片文字识别的实现之PaddleOCR

目录项目使用项目结构环境部署 1.安装Anaconda,构造虚拟环境 2.依赖包下载测试代码参数补充总结前言什么是OCR? 光学字符识别(Optical Character Recognition, OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程.简而言之,检测图像中的文本资料,并且识别出文本的内容. 那么有哪些应用场景呢? 其实我们日常生活中处处都有ocr的影子,比如在疫情期间身份证识别录入信息.车辆车牌号识别.自动驾驶等.我们的生活中,机器学习已
python PaddleOCR库用法及知识点详解

说明 1.PaddleOCR是基于深度学习的ocr识别库,中文识别精度相当还不错,能够应对大多数文字提取需求. 2.需要依次安装三个依赖库,shapely库可能会受到系统的影响,出现安装错误. 安装命令 pip install paddlepaddle pip install shapely pip install paddleocr 代码实现 ocr = PaddleOCR(use_angle_cls=True,) # 输入待识别图片路径 img_path = r"d:\Desktop\4A3
PaddleOCR 识别表情包文字示例详解

目录引言安装 PaddleOCR 本地处理在 flask 中处理引言最近在做个表情包的小程序,涉及到表情包搜索功能.我们上传表情包的时候,只有一张图,怎么搜索?这个时候我们想到就是将表情包的文字提取出来,作为搜索的内容.那么这就需要用到 ocr 技术了. 经过几个 ocr 的库的使用,小编强烈推荐使用 PaddleOCR,一款文本识别效果不输于商用的Python库! 对于 PaddleOCR 本文不会过多介绍,可自行搜索.重点是如何使用 PaddleOCR 解决我的问题. 安装 Pad
支持cjs及esm的npm包实现示例详解

目录正文 tsc cjs esm package.json rollup rollup.config.js package.json webpack webpack.config.js package.json esbuild 正文模块化是一个老生常谈的问题了,打包工具层出不穷. 那么,如何利用这些打包工具去打出既支持cjs,又支持esm的npm包呢. 这篇文章不涉及概念,是一些打包实测. demo repo: github.com/FrankKai/np… 可以clone下来,本地构建测试
Go库text与template包使用示例详解

目录场景 text/template 包基本用法模板语法空白字符常用 Action 函数总结场景现在的项目,基本都是前后端分离,后端只要提供Json等格式的数据就行.在这个背景下,模板渲染这个功能备受冷落,很少会在项目中用到. 虽然在 http 服务中,模板解析不常用,但日常开发中,巧妙利用模板生成代码,能使我们开发事半功倍.比如: 使用模板初始化项目.比如我们每次新建一个 http 服务,可能都需要 promethue 监控.日志等模块.每次都实现一遍不现实,(或者 copy
Python程序包的构建和发布过程示例详解

关于我编程界的一名小程序猿,目前在一个创业团队任team lead,技术栈涉及Android.Python.Java和Go,这个也是我们团队的主要技术栈. 联系:hylinux1024@gmail.com 当我们开发了一个开源项目时,就希望把这个项目打包然后发布到 pypi.org 上,别人就可以通过 pip install 的命令进行安装.本文的教程来自于 Python 官方文档 , 如有不正确的地方欢迎评论拍砖. 0x00 创建项目本文使用到的项目目录为 ➜ packaging-tuto
Springboot自动扫描包路径来龙去脉示例详解

我们暂且标注下Springboot启动过程中较为重要的逻辑方法,源码对应的spring-boot-2.2.2.RELEASE版本 public ConfigurableApplicationContext run(String... args) { StopWatch stopWatch = new StopWatch(); stopWatch.start(); ConfigurableApplicationContext context = null; Collection<SpringBoo
python计算机视觉opencv卡号识别示例详解

目录一.模板预处理 1.将模板设置为二值图 2.检测模板的轮廓 3.对模板轮廓排序,并将数字和轮廓一一对应,以字典存储 4.备注二.图片预处理 1.初始化卷积核 2.图片预处理第一部分 3.图像预处理第二部分三.轮廓处理 1.大轮廓过滤 2.小轮廓分割模板图片如下: 需识别的图片如下: 一.模板预处理 1.将模板设置为二值图 2.检测模板的轮廓 3.对模板轮廓排序,并将数字和轮廓一一对应,以字典存储排序的函数如下: 排序并存储: 4.备注 ①每一个数字对应的是二值图截出来的那个数字图的
基于Opencv图像识别实现答题卡识别示例详解

目录 1. 项目分析 2.项目实验 3.项目结果总结在观看唐宇迪老师图像处理的课程中,其中有一个答题卡识别的小项目,在此结合自己理解做一个简单的总结. 1. 项目分析首先在拿到项目时候,分析项目目的是什么,要达到什么样的目标,有哪些需要注意的事项,同时构思实验的大体流程. 图1. 答题卡测试图像比如在答题卡识别的项目中,针对测试图片如图1 ,首先应当实现的功能是: 能够捕获答题卡中的每个填涂选项. 将获取的填涂选项与正确选项做对比计算其答题正确率. 2.项目实验在对测试图像进行形态学操
Unity实现植物识别示例详解

接口介绍: 可识别超过2万种常见植物和近8千种花卉,接口返回植物的名称,并支持获取识别结果对应的百科信息:还可使用EasyDL定制训练平台,定制识别植物种类.适用于拍照识图.幼教科普.图像内容分析等场景. 创建应用: 在产品服务中搜索图像识别,创建应用,获取AppID.APIKey.SecretKey信息: 查阅官方文档,以下是植物识别接口返回数据参数详情: 定义数据结构: using System; /// <summary> /// 植物识别 /// </summary> [S
Python基于keras训练实现微笑识别的示例详解

目录一.数据预处理二.训练模型创建模型训练模型训练结果三.预测效果四.源代码 pretreatment.py train.py predict.py 一.数据预处理实验数据来自genki4k 提取含有完整人脸的图片 def init_file(): num = 0 bar = tqdm(os.listdir(read_path)) for file_name in bar: bar.desc = "预处理图片: "
R语言UpSet包实现集合可视化示例详解

目录前言一.R包及数据二.upset()函数 1)基本参数 2)queries参数 3)attribute.plots参数 3.1 添加柱形图和散点图 3.2 添加箱线图 3.3 添加密度曲线图前言介绍一个R包UpSetR,专门用来集合可视化,当多集合的韦恩图不容易看的时候,就是它大展身手的时候了. 一.R包及数据 #安装及加载R包 #install.packages("UpSetR") library(UpSetR) #载入数据集 data <- read.csv(&

PaddleOCR 识别表情包文字示例详解

目录

引言

安装 PaddleOCR

本地处理

在 flask 中处理

相关推荐

随机推荐