python计算机视觉opencv图像金字塔轮廓及模板匹配

2025-02-18 14:16:29

1.图像金字塔

①高斯金字塔

向下采样，数据会越来越少，减少的方式是：将偶数行和列删除

向上采样，数据会越来越多，将图像在每个方向上扩大为原来的两倍，新增的行和列用0来填充。使用先前同样的内核与放大后的图像卷积，获得近似值。

上采样之后，图片会变大。

下采样后，图片会变小。

②拉普拉斯金字塔

对于原始图像，先执行下采样，再执行上采样，并用原始图像减去得到的采样结果。

以上的计算方式为1层，第二层的计算，把第一层得到的结果作为原始图像进行计算。

2.图像轮廓

cv.findContours(img,mode,method)

最常用的mode：

RETR_TREE，检测所有的轮廓，并重构嵌套轮廓的整个层次

最常用的method：

CHAIN_APPROX_NONE：以Freeman链码的方式输出轮廓，所有其他方法输出多边形（顶点的序列）

CHAIN_APPROX_SIMPLE：压缩水平的、垂直的和斜的部分，也就是函数只保留他们的终点部分。

①寻找轮廓

函数返回的第一个参数contours就是我们所需要的轮廓信息。它是一个列表的形式。每一个元素都是数组形式。一个图像中可能有多个轮廓，并且会有外轮廓以及内轮廓，均可通过返回的contours调用。

②轮廓特征

通过调用不同的函数可以求得轮廓的面积以及周长等。

③轮廓绘制

第一个参数就是要画上去的图，第二个是轮廓信息，第三个是轮廓的索引，第四个是使用的颜色通道，第五个是线条的宽度。

也可以画出轮廓的边界矩形或者外接圆：

3.模板匹配

模板匹配模板在原图像上，从原点开始滑动，计算模板与图像被模板覆盖的地方的差别程度，这个差别程度在opencv里有6种，然后将每次计算的结果放在一个矩阵里，作为结果输出。假如原图像是AB，模板是ab大小，则输出结果是(A-a+1) * (B-b+1)

TM_SQDIFF：平方差异，越小越相关

TM_CCORR：相关性，越大越相关

TM_CCOEFF：相关系数，越大越相关

TM_SQDIFF_NORMED：归一化平方不同，越接近0越相关

TM_CCORR_NORMED：归一化相关性，越接近1越相关

TM_CCOEFF_NORMED：归一化相关系数，越接近1越相关

建议：尽量使用归一化的方法

①模板匹配

读取图片以及需要匹配的模板，并将其进行灰度化处理：

下面得到的h,w就是模板的长和宽

通过matchTemplate的方法进行匹配：

②匹配框线绘制

对于匹配所得的返回值，通过minMaxLoc得到最小值和最大值，以及各自对应的坐标。根据选择的方法不同，所需要的目标值不同。比如TM_SQDIFF_NORMED：归一化平方不同，就是越接近0越相关，即越小越好。

得到了最佳的值以及坐标，就可以画出来矩形框。

在rectangle方法中，参数依次是：要画框的图片，框的左上角坐标，框的右下角坐标，框的亮度，框的线条粗细。结果如下：

③多对象匹配

模板匹配也可匹配多个对象，若图片中有多个和模板匹配的内容，cv.matchTemplate返回的内容中会有多个分数高的结果，设定阈值后，把分数高的结果的坐标，按同样的方式处理，把方框全部画出来即可。

4.直方图统计

①直方图绘制

可直接通过plt.hist方法，将图像矩阵扁平化之后，绘制不同的像素出现的频率直方图。

②直方图统计

cv2.calcHist(images,channels,mask,histSize,ranges)

参数中：

imges：传入的图像

channels：颜色通道，如果是灰度图就是[0]，如果是彩色可以是[0],[1],[2]。分别对应着BGR。

mask：掩膜，如果需要对图像进行掩膜处理可以传入此参数。

histSize：就是bin的数目，可以直接填入[256]

ranges：像素值范围，常为：[0,256]

注意：传入参数时，都需要用中括号括起来。

calcHist返回值是对应颜色的统计值。当i是0的时候，就是B，1对应G，2对应R

③直方图的mask操作

创建mask，此处使用图片的长宽作为mask的长宽，并把需要展示的地方置为1，其他地方置为0即可。

通过bitwise_and，即“与”操作，即可实现掩膜操作。

把Mask应用到图片中，并画出直方图：

④直方图均衡化

通过cv.equalizeHist方法，可以对直方图进行均衡化

直方图前后对比如下：

对应的图像发生的变化如下：

以上的方式是对全局直接进行均衡化。可以看出图中雕像的脸变得模糊。通过自适应直方图均衡化可解决此问题，自适应均衡化是通过将图片分成不同的小块，对每一小块进行各自的均衡化。

5.傅里叶变换

低通滤波是保留低频，图像会变得模糊。高通滤波是保留高频，图像的细节会增强。

在opencv中主要是cv2.dft()和cv2.idft()，输入图像需要先转换成np.float32的格式得到的结果中，频率为0的部分会在左上角，通常要转换到中心位置，可以通过shift变换来实现 cv2.dft()得到的结果是双通道的（实部、虚部），通常还需要转换成图像格式才能展示（0,255）

上图是将图片转换到频域之后，转换成灰度图并且展示的形式。

在低通滤波中，当转换到频域并把低频的放到中间后，只需要设置一个掩膜，即可把图像高频滤除掉。然后在通过逆转换，还原图像即可。具体代码如下：

在高通滤波器中，只需要把上面的代码中的掩膜转换一下，把0换成1,1换成0即可实现高通滤波。最终的图片展示如下：

可以看出，图片只保留了高频，也就是变化剧烈的部分，也就是图像中的边缘。

以上就是python计算机视觉opencv图像金字塔轮廓及模板匹配的详细内容，更多关于python opencv图像金字塔轮廓及模板匹配的资料请关注我们其它相关文章！

详解OpenCV图像的概念和基本操作

前言: opencv最主要的的功能是用于图像处理,所以图像的概念贯穿了整个opencv,与其相关的核心类就是Mat. 像素: 图片尺寸以像素为单位时,每一厘米等于28像素,如1515厘米长度的图片,等于420420像素的长度.一个像素所能表达的不同颜色数取决于比特每像素(BPP). 灰度图像:8bpp=2的8次方=256色, 高彩色:16bpp=2的16次方=65536色, 真彩色:24bpps=2的24次方=16777216色. 图像分辨率: 图像分辨率是图像总像素的多少,由于图像通常用矩阵表
opencv python简易文档之图片基本操作指南

前言最近在学习opencv,使用的是python接口.于是想着写些相关的笔记供以后参考,有不足之处希望大家指出. 使用python学习opencv需要下载opencv第三方库. 使用pip安装即可. 安装命令: pip install opencv-python pip install opencv-contrib-python(opencv的贡献库) 引入opencv import cv2 读取图片: img=cv2.imread('cat.jpg') # cat.jpg路径为相对路径 #
Python opencv操作深入详解

直接读取图片 def display_img(file="p.jpeg"): img = cv.imread(file) print (img.shape) cv.imshow('image',img) cv.waitKey(0) cv.destroyAllWindows() 读取灰度图片 def display_gray_img(file="p.jpeg"): img = cv.imread(file,cv.IMREAD_GRAYSCALE) print (img
Python-OpenCV基本操作方法详解

基本属性 cv2.imread(文件名,属性) 读入图像属性:指定图像用哪种方式读取文件 cv2.IMREAD_COLOR:读入彩色图像,默认参数,Opencv 读取彩色图像为BGR模式 !!!注意 cv2.IMREAD_GRAYSCALE:读入灰度图像. cv2.imshow(窗口名,图像文件) 显示图像可以创建多个窗口 cv2.waitKey() 键盘绑定函数函数等待特定的几毫秒,看是否由键盘输入. cv2.namedWindow(窗口名,属性) 创建一个窗口属性:指定窗口大小模式
OpenCV半小时掌握基本操作之图像基础操作

目录概述截取图像获取颜色通道读取视频 [OpenCV]⚠️高手勿入! 半小时学会基本操作⚠️ 图像基础操作概述 OpenCV 是一个跨平台的计算机视觉库, 支持多语言, 功能强大. 今天小白就带大家一起携手走进 OpenCV 的世界. 截取图像例子: # 截取图像 img = cv2.imread("picture.jpg") img = img[200:600, 400:1000] cv2.imshow("cut", img) cv2.waitKey(
python计算机视觉opencv图像金字塔轮廓及模板匹配

目录 1.图像金字塔 ①高斯金字塔 ②拉普拉斯金字塔 2.图像轮廓 ①寻找轮廓 ②轮廓特征 ③轮廓绘制 3.模板匹配 ①模板匹配 ②匹配框线绘制 ③多对象匹配 4.直方图统计 ①直方图绘制 ②直方图统计 ③直方图的mask操作 ④直方图均衡化 5.傅里叶变换 1.图像金字塔 ①高斯金字塔向下采样,数据会越来越少,减少的方式是:将偶数行和列删除向上采样,数据会越来越多,将图像在每个方向上扩大为原来的两倍,新增的行和列用0来填充.使用先前同样的内核与放大后的图像卷积,获得近似值. 上采样之后,图
python OpenCV图像金字塔

目录 1.图像金字塔理论基础 2.向下取样函数及使用 3.向上取样函数及使用 4.采样可逆性研究 5.拉普拉斯金字塔 6.图像轮廓介绍轮廓近似 1.图像金字塔理论基础图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构.一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合.其通过梯次向下采样获得,直到达到某个终止条件才停止采样.我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低.那我们为什么要做图像金字塔呢?这
python计算机视觉opencv矩形轮廓顶点位置确定

目录一.问题的引入二.问题的解决方法方法一: 方法二三.一些实现代码一.问题的引入 opencv在图像处理方面有着非常强大的功能,当我们需要使用opencv进行一些图像的矫正工作时,我们通常需要找到原图的一些关键点,然后计算变换后的图像坐标,最后通过仿射变换或者透视变换获得自己想要的矫正图像,比如将一张拍歪了的纸进行矫正,我们的首要任务就是找到原图的一些关键点,通常的做法就是找纸张的4个顶点. 二.问题的解决方法第一步我们肯定要找到纸张相应的矩形轮廓,这里可以二值化再找,也可以使用一
Python OpenCV 图像区域轮廓标记(框选各种小纸条)

学在前面上篇 OpenCV 博客原计划完成一个识别银行卡号的项目,但是写的过程中发现,技术储备不足,我无法在下述图片中,提取出卡号区域,也就无法进行后续的识别了,再次意识到了自己技术还不达标,继续学习.完不成,就实现其它学习项目. 轮廓识别实战先看一下最终实现的效果,针对一张图片(该图片前景色和背景色差异较大),进行轮廓标记. 图片基本处理 import cv2 as cv src = cv.imread("./demo.jpg") gray = cv.cvtColor(src,
python计算机视觉opencv卡号识别示例详解

目录一.模板预处理 1.将模板设置为二值图 2.检测模板的轮廓 3.对模板轮廓排序,并将数字和轮廓一一对应,以字典存储 4.备注二.图片预处理 1.初始化卷积核 2.图片预处理第一部分 3.图像预处理第二部分三.轮廓处理 1.大轮廓过滤 2.小轮廓分割模板图片如下: 需识别的图片如下: 一.模板预处理 1.将模板设置为二值图 2.检测模板的轮廓 3.对模板轮廓排序,并将数字和轮廓一一对应,以字典存储排序的函数如下: 排序并存储: 4.备注 ①每一个数字对应的是二值图截出来的那个数字图的
基于python使用OpenCV进行物体轮廓排序

目录 1 引言 2 栗子 2.1 读取图像 2.2 获取轮廓 2.3 轮廓排序 2.4 其他结果 3 总结 1 引言在进行图像处理过程中,我们经常会遇到一些和物体轮廓相关的操作,比如求目标轮廓的周长面积等,我们直接使用Opencv的findContours函数可以很容易的得到每个目标的轮廓,但是可视化后, 这个次序是无序的,如下图左侧所示: 本节打算实现对物体轮廓进行排序,可以实现从上到下排序或者从左倒右排序,达到上图右侧的可视化结果. 2 栗子 2.1 读取图像首先,我们来读取图像,并得到
Python图像处理之图像金字塔详解

目录一.图像金字塔原理二.图像向上取样三.图像向下取样四.总结一.图像金字塔原理上一篇文章讲解的图像采样处理可以降低图像的大小,本文将补充图像金字塔知识,了解专门用于图像向上采样和向下采样的pyrUp()和pyrDown()函数. 图像金字塔是指由一组图像且不同分别率的子图集合,它是图像多尺度表达的一种,以多分辨率来解释图像的结构,主要用于图像的分割或压缩.一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合.如图10-1所示,它包括了四层图像,将
python计算机视觉OpenCV入门讲解

目录前言一.什么是计算机视觉二.图片处理基础操作图片处理:读入图像图片处理:显示图像图片处理:图像保存三.图像处理入门基础图像成像原理介绍图像分类四.灰度图像五.彩色图像(RGB) 六.像素处理操作读取像素修改像素使用python中的numpy修改像素点七.获取图像属性形状像素数目图像类型八.图像ROI 九.通道的拆分与合并拆分合并前言本专栏将非常细致的讲解相关与计算机视觉OpenCV的相关知识即操作,非常的简单易懂.本文主要讲解相关与计算机视觉的相
OpenCV 图像金字塔的实现示例

目录 1.高斯金字塔 2.拉普拉斯金字塔本文主要介绍了OpenCV 图像金字塔,具有一定的参考价值,感兴趣的可以了解一下高斯金字塔reduce void cv::pyrDown() expand void cv::pyrUp() 1.高斯金字塔图像金字塔是对一张输入图像先模糊再下采样为原来的高.宽的1/2,不断重复模糊与下采样的过程就得到了不同分辨率的输出图像,叠加在一起就形成了图像金字塔. 高斯金字塔便是先进行高斯模糊,再进行reduce和expand操作.高斯金字塔中的较高级别(低分辨
python中opencv图像叠加、图像融合、按位操作的具体实现

目录 1图像叠加 2图像融合 3按位操作 1图像叠加可以通过OpenCV函数cv.add()或简单地通过numpy操作添加两个图像,res = img1 + img2.两个图像应该具有相同的深度和类型,或者第二个图像可以是标量值. NOTE: OpenCV添加是饱和操作,也就是有上限值,而Numpy添加是模运算. 添加两个图像时, OpenCV功能将提供更好的结果.所以总是更好地坚持OpenCV功能. 代码: import cv2 import numpy as np x = np.uint8