OpenCV(python)版实现文本分割之水平投影法

2025-04-22 08:04:00

对于如下一张图片，如何将文本区域分割成一行一行的了？

在文本分割领域中有一种很优秀的算法：投影法，包括水平投影法和垂直投影法。本文主要讲述水平投影法，水平投影法可以理解为一束光线从图像的左侧向右边进行照射，每一条光线可以理解为图像的一行，计算每一行上图像的黑色像素点，从而可以对图像进行分割。

import numpy as np
import cv2 

def get_vvList(list_data):
    #取出list中像素存在的区间
    vv_list=list()
    v_list=list()
    for index,i in enumerate(list_data):
        if i>0:
            v_list.append(index)
        else:
            if v_list:
                vv_list.append(v_list)
                #list的clear与[]有区别
                v_list=[]
    return vv_list

if __name__=='__main__':
    img_bgr=cv2.imread('./testImg/1.png',1)
    if not img_bgr is None:
        img=img_bgr.copy()
        img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
        #二值化
        t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY)
        '''
        水平投影从左向右投射，计算每一行的黑色像素总数
        '''
        rows,cols=binary.shape
        hor_list=[0]*rows
        for i in range(rows):
            for j in range(cols):
                #统计每一行的黑色像素总数
                if binary.item(i,j)==0:
                    hor_list[i]=hor_list[i]+1
        '''
        对hor_list中的元素进行筛选，可以去除一些噪点
        '''
        hor_arr=np.array(hor_list)
        hor_arr[np.where(hor_arr<5)]=0
        hor_list=hor_arr.tolist()

        #绘制水平投影
        img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255
        for i in range(rows):
            pt1=(cols-1,i)
            pt2=(cols-1-hor_list[i],i)
            cv2.line(img_white,pt1,pt2,(0,),1)
        cv2.imshow('水平投影',img_white)
        cv2.waitKey(0)

        #取出各个文字区间
        vv_list=get_vvList(hor_list)
        for i in vv_list:
            img_hor=img_bgr[i[0]:i[-1],:,:]
            cv2.imshow('文本行',img_hor)
            cv2.waitKey(0)

运行上述代码，可以看到水平投影的效果。

根据投影法的特征，可以很容易就将上述文本分割成文本行，如下图所示：

到此这篇关于OpenCV(python)版实现文本分割之水平投影法的文章就介绍到这了,更多相关OpenCV水平投影内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

OpenCV计算图像的水平和垂直积分投影

本文实例为大家分享了OpenCV计算图像的水平和垂直积分投影的具体代码,供大家参考,具体内容如下 #include <cv.h> #include <highgui.h> #pragma comment( lib, "cv.lib" ) #pragma comment( lib, "cxcore.lib" ) #pragma comment( lib, "highgui.lib" ) int main() { IplIma
OpenCV(python)版实现文本分割之水平投影法

对于如下一张图片,如何将文本区域分割成一行一行的了? 在文本分割领域中有一种很优秀的算法:投影法,包括水平投影法和垂直投影法.本文主要讲述水平投影法,水平投影法可以理解为一束光线从图像的左侧向右边进行照射,每一条光线可以理解为图像的一行,计算每一行上图像的黑色像素点,从而可以对图像进行分割. import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的区间 vv_list=list() v_list=list() f
基于OpenCV(python)的实现文本分割之垂直投影法

在我的上一篇博客中讲述了水平投影法取出文本行图像的实现,在这里将用垂直投影法对文本行的每个字符进行分割.下图是用水平投影法切割的文本行: 文本分割的原理如下,先用水平投影取出单一文本行,接着使用垂直投影法达到对单个字符进行分割. 代码如下: import numpy as np import cv2 def get_vvList(list_data): #取出list中像素存在的区间 vv_list=list() v_list=list() for index,i in enumerate(li
Python+opencv 实现图片文字的分割的方法示例

实现步骤: 1.通过水平投影对图形进行水平分割,获取每一行的图像: 2.通过垂直投影对分割的每一行图像进行垂直分割,最终确定每一个字符的坐标位置,分割出每一个字符: 先简单介绍一下投影法:分别在水平和垂直方向对预处理(二值化)的图像某一种像素进行统计,对于二值化图像非黑即白,我们通过对其中的白点或者黑点进行统计,根据统计结果就可以判断出每一行的上下边界以及每一列的左右边界,从而实现分割的目的. 下面通过Python+opencv来实现该功能首先来实现水平投影: import cv2 impor
python版opencv摄像头人脸实时检测方法

OpenCV版本3.3.0,注意模型文件的路径要改成自己所安装的opencv的模型文件的路径,路径不对就会报错,一般在opencv-3.3.0/data/haarcascades 路径下 import numpy as np import cv2 face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml') cap = cv2.VideoCapture(0) while True: ret,img = ca
python 使用OpenCV进行简单的人像分割与合成

实现思路通过背景建模的方法,对源图像中的动态人物前景进行分割,再将目标图像作为背景,进行合成操作,获得一个可用的合成影像. 实现步骤如下. 使用BackgroundSubtractorMOG2进行背景分割 BackgroundSubtractorMOG2是一个以高斯混合模型为基础的背景前景分割算法, 混合高斯模型分布概率是K个高斯分布的和,每个高斯分布有属于自己的 μμ 和 σσ 参数,以及对应的权重参数,权重值必须为正数,所有权重的和必须等于1,以确保公式给出数值是合理的概率密度值.换句话
iPod文本分割器(VBS版)

因此暑假闲暇编写了这个简短精悍的脚本版的分割器.脚本版的最大的好处可以由使用者进行DIY. 具体情况就不多说了,关于txt编码的问题可以参考,iPod文本分割器这里仅仅说明使用方法,将您需要分割的Txt文件直接拖放发到本脚本上就ok了. 以下是脚本代码,直接复制后保存为vbs文件就可以了! Good Luck ! 复制代码代码如下: '------------------------------------------------------------ ' Description : Te
Python实现投影法分割图像示例(二)

在上篇博客中,我们已经实现了水平投影和垂直投影图的绘制.接下来,我们可以根据获得的投影数据进行图像的分割,该法用于文本分割较多,所以此处依然以上次的图为例. 先把上次的两幅图搬过来,方便讲解. 上面两图分别从垂直和水平方向描述了图像中文本的分布.我们想象一下,将两幅图重叠起来(当然这里比例要调整下),那么我们就能得到四个重叠的白块,而这些白块所处的位置正是原图中文本的位置.所以接下来的任务就是,找出这些白块的坐标,此处白块近似矩形,所以我们要求矩形的四个坐标. 下面看代码. #根据水平投影值选定
Python实现投影法分割图像示例(一)

投影法多用于图像的阈值分割.闲话不多说,现用Python实现. 上代码. import cv2 import numpy img = cv2.imread('D:/0.jpg', cv2.COLOR_BGR2GRAY) height, width = img.shape[:2] #resized = cv2.resize(img, (3*width,3*height), interpolation=cv2.INTER_CUBIC) #二值化 (_, thresh) = cv2.threshold
opencv python 对指针仪表读数识别的两种方式

我尝试了两种方式用opencv 对指针仪表进行读数识别, 1. 先模板匹配,然后边缘检测 + 霍夫直线 2. 按轮廓大小过滤,然后边缘检测 + 霍夫直线两种方式对光线都非常敏感其中第一种的应用范围更广,背景复杂一点也能识别到个人比较喜欢这种方式第二种的限制多一点,对背景.光线条件要求比较高对于固定位置,且明暗变化不大的情况下,这种方式还是很有效的先说第一个方案,第二个方式就不说了第一种方式:模板匹配,然后边缘检测 + 霍夫直线 if __name__ == "__main__&q
Python读取word文本操作详解

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下. 一,docx模块 Python可以利用python-docx模块处理word文档,处理方式是面向对象的.也就是说python-docx模块会把word文档,文档中的段落.文本.字体等都看做对象,对对象进行处理就是对word文档的内容处理. 二,相关概念如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念. 1,Docume

OpenCV(python)版实现文本分割之水平投影法

相关推荐

随机推荐