基于OpenCV(python)的实现文本分割之垂直投影法

2025-01-30 01:03:53

在我的上一篇博客中讲述了水平投影法取出文本行图像的实现，在这里将用垂直投影法对文本行的每个字符进行分割。下图是用水平投影法切割的文本行：

文本分割的原理如下，先用水平投影取出单一文本行，接着使用垂直投影法达到对单个字符进行分割。

代码如下：

import numpy as np
import cv2 

def get_vvList(list_data):
    #取出list中像素存在的区间
    vv_list=list()
    v_list=list()
    for index,i in enumerate(list_data):
        if i>0:
            v_list.append(index)
        else:
            if v_list:
                vv_list.append(v_list)
                #list的clear与[]有区别
                v_list=[]
    return vv_list

if __name__=='__main__':
    img_bgr=cv2.imread('./testImg/2.png',1)
    if not img_bgr is None:
        img=img_bgr.copy()
        img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        #二值化
        t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
        '''
        垂直投影为从上往下投射，统计每一列的黑色像素总数
        '''
        rows,cols=binary.shape
        ver_list=[0]*cols
        for j in range(cols):
            for i in range(rows):
                if binary.item(i,j)==0:
                    ver_list[j]=ver_list[j]+1
        '''
        对ver_list中的元素进行筛选，可以去除一些噪点
        '''
        ver_arr=np.array(ver_list)
        ver_arr[np.where(ver_arr<1)]=0
        ver_list=ver_arr.tolist()

        #绘制垂直投影
        img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
        for j in range(cols):
            pt1=(j,rows-1)
            pt2=(j,rows-1-ver_list[j])
            cv2.line(img_white,pt1,pt2,(0,),1)
        cv2.imshow('垂直投影',img_white)
        cv2.waitKey(0)

        #切割单一字符
        vv_list=get_vvList(ver_list)
        for i in vv_list:
            img_ver=img_bgr[:,i[0]:i[-1]]
            cv2.imshow('单一字符',img_ver)
            cv2.waitKey(0)

运行程序，垂直投影图像如下图所示：

分割的单一字符如下图：

单个数字已经正确分割出来了。

到此这篇关于基于OpenCV(python)的实现文本分割之垂直投影法的文章就介绍到这了,更多相关OpenCV垂直投影内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

OpenCV计算图像的水平和垂直积分投影

本文实例为大家分享了OpenCV计算图像的水平和垂直积分投影的具体代码,供大家参考,具体内容如下 #include <cv.h> #include <highgui.h> #pragma comment( lib, "cv.lib" ) #pragma comment( lib, "cxcore.lib" ) #pragma comment( lib, "highgui.lib" ) int main() { IplIma
基于OpenCV(python)的实现文本分割之垂直投影法

在我的上一篇博客中讲述了水平投影法取出文本行图像的实现,在这里将用垂直投影法对文本行的每个字符进行分割.下图是用水平投影法切割的文本行: 文本分割的原理如下,先用水平投影取出单一文本行,接着使用垂直投影法达到对单个字符进行分割. 代码如下: import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的区间 vv_list=list() v_list=list() for index,i in enumerate(li
OpenCV(python)版实现文本分割之水平投影法

对于如下一张图片,如何将文本区域分割成一行一行的了? 在文本分割领域中有一种很优秀的算法:投影法,包括水平投影法和垂直投影法.本文主要讲述水平投影法,水平投影法可以理解为一束光线从图像的左侧向右边进行照射,每一条光线可以理解为图像的一行,计算每一行上图像的黑色像素点,从而可以对图像进行分割. import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的区间 vv_list=list() v_list=list() f
如何基于OpenCV&Python实现霍夫变换圆形检测

简述基于python使用opencv实现在一张图片中检测出圆形,并且根据坐标和半径标记出圆.不涉及理论,只讲应用. 霍夫变换检测圆形的原理其实检测圆形和检测直线的原理差别不大,只不过直线是在二维空间,因为y=kx+b,只有k和b两个自由度.而圆形的一般性方程表示为(x-a)²+(y-b)²=r².那么就有三个自由度圆心坐标a,b,和半径r.这就意味着需要更多的计算量,而OpenCV中提供的cvHoughCircle()函数里面可以设定半径r的取值范围,相当于有一个先验设定,在每一个r来说,在
python基于OpenCV模板匹配识别图片中的数字

前言本博客主要实现利用OpenCV的模板匹配识别图像中的数字,然后把识别出来的数字输出到txt文件中,如果识别失败则输出"读取失败". 操作环境: OpenCV - 4.1.0 Python 3.8.1 程序目标单个数字模板:(这些单个模板是我自己直接从图片上截取下来的) 要处理的图片: 终端输出: 文本输出: 思路讲解代码讲解首先定义两个会用到的函数第一个是显示图片的函数,这样的话在显示图片的时候就比较方便了 def cv_show(name, img): cv2.imsh
python 基于opencv 绘制图像轮廓

图像轮廓概念轮廓是一系列相连的点组成的曲线,代表了物体的基本外形. 谈起轮廓不免想到边缘,它们确实很像.简单的说,轮廓是连续的,边缘并不全都连续(下图).其实边缘主要是作为图像的特征使用,比如可以用边缘特征可以区分脸和手:而轮廓主要用来分析物体的形态,比如物体的周长和面积等,可以说边缘包括轮廓. 寻找轮廓的操作一般用于二值图像,所以通常会使用阈值分割或Canny边缘检测先得到二值图. 注意:寻找轮廓是针对白色物体的,一定要保证物体是白色,而背景是黑色,不然很多人在寻找轮廓时会找到图片最外面的一
python 使用OpenCV进行简单的人像分割与合成

实现思路通过背景建模的方法,对源图像中的动态人物前景进行分割,再将目标图像作为背景,进行合成操作,获得一个可用的合成影像. 实现步骤如下. 使用BackgroundSubtractorMOG2进行背景分割 BackgroundSubtractorMOG2是一个以高斯混合模型为基础的背景前景分割算法, 混合高斯模型分布概率是K个高斯分布的和,每个高斯分布有属于自己的 μμ 和 σσ 参数,以及对应的权重参数,权重值必须为正数,所有权重的和必须等于1,以确保公式给出数值是合理的概率密度值.换句话
Python机器视觉之基于OpenCV的手势检测

目录 1 简介 2 传统机器视觉的手势检测 2.1 轮廓检测法 2.2 算法结果 2.3 整体代码实现 3 深度学习方法做手势识别 3.1 经典的卷积神经网络 3.2 YOLO系列 3.3 SSD 3.4 实现步骤 3.5 关键代码 4 实现手势交互 1 简介今天学长向大家介绍一个机器视觉项目基于机器视觉opencv的手势检测手势识别算法 2 传统机器视觉的手势检测普通机器视觉手势检测的基本流程如下: 其中轮廓的提取,多边形拟合曲线的求法,凸包集和凹陷集的求法都是采用opencv中自带
python基于Tkinter库实现简单文本编辑器实例

本文实例讲述了python基于Tkinter库实现简单文本编辑器的方法.分享给大家供大家参考.具体实现方法如下: ## {{{ http://code.activestate.com/recipes/578568/ (r1) from Tkinter import * from tkSimpleDialog import askstring from tkFileDialog import asksaveasfilename from tkMessageBox import askokcance
Python+opencv 实现图片文字的分割的方法示例

实现步骤: 1.通过水平投影对图形进行水平分割,获取每一行的图像: 2.通过垂直投影对分割的每一行图像进行垂直分割,最终确定每一个字符的坐标位置,分割出每一个字符: 先简单介绍一下投影法:分别在水平和垂直方向对预处理(二值化)的图像某一种像素进行统计,对于二值化图像非黑即白,我们通过对其中的白点或者黑点进行统计,根据统计结果就可以判断出每一行的上下边界以及每一列的左右边界,从而实现分割的目的. 下面通过Python+opencv来实现该功能首先来实现水平投影: import cv2 impor
Python基于OpenCV实现人脸检测并保存

本文实例为大家分享了Python基于OpenCV实现人脸检测,并保存的具体代码,供大家参考,具体内容如下安装opencv 如果安装了pip的话,Opencv的在windows的安装可以直接通过cmd命令pip install opencv-python(只需要主要模块),也可以输入命令pip install opencv-contrib-python(如果需要main模块和contrib模块) 详情可以点击此处导入opencv import cv2 所有包都包含haarcascade文件.这

基于OpenCV(python)的实现文本分割之垂直投影法

相关推荐

随机推荐