OpenCV图像分割之分水岭算法与图像金字塔算法详解

2025-06-04 12:05:56

前言

主要介绍OpenCV中的分水岭算法、图像金字塔对图像进行分割的方法。

一、使用分水岭算法分割图像

分水岭算法的基本原理为：将任意的灰度图像视为地形图表面，其中灰度值高的部分表示山峰和丘陵，而灰度值低的地方表示山谷。用不同颜色的水(标签)填充每个独立的山谷(局部最小值)；随着水平面的上升，来自不同山谷(具有不同颜色)的水将开始合并。为了避免出现这种情况，需要在水汇合的位置建造水坝；持续填充水和建造水坝，直到所有的山峰和丘陵都在水下。整个过程中建造的水坝将作为图像分割的依据。

使用分水岭算法执行图像分割操作时通常包含下列步骤：

(1) 将原图转换为灰度图像

(2) 应用形态变换中的开运算和膨胀操作，去除图像噪声，获得图像边缘信息，确定图像背景

(3) 进行距离转换，再进行阈值处理，确定图像前景

(4) 确定图像的未知区域(用图像的背景减去前景剩余的部分)

(5) 标记背景图像

(6) 执行分水岭算法分割图像

1、cv2.distanceTransform()函数

OpenCV中的cv2.distanceTransform()函数用于计算非0值像素点到0值(背景)像素点的距离，其基本格式如下：

dst = cv2.distanceTransform(src, distanceType, maskSize[, dstType])

dst为返回的距离转换结果图像

src为原图像, 必须是8为单通道二值图像

distanceType为距离类型

maskSize为掩膜的大小, 可设置为0, 3或5

dstType为返回的图像类型, 默认值为CV_32F(32位浮点数)

import cv2
import numpy as np
import matplotlib.pyplot as plt

# cv2.distanceTransform()函数，计算非0值像素点到0值(背景)像素点的距离
img = cv2.imread('home.jpg')
cv2.imshow('original', img)

img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) 										# 灰度操作
cv2.imshow('gray', img_gray)

ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) 	# 阈值操作
cv2.imshow('thresh', thresh)

kernel = np.ones((3, 3), np.uint8)
img_open = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2) 				# 形态学操作
cv2.imshow('open', img_open)

img_dilate = cv2.dilate(img_open, kernel, iterations=2)    								# 膨胀操作，确定背景
cv2.imshow('img_dilate', img_dilate)

img_dist = cv2.distanceTransform(img_dilate , cv2.DIST_L2, 5) 							# 距离转换
cv2.imshow('img_dist', img_dist)

cv2.waitKey(0)
cv2.destroyAllWindows()

2、cv2.connectedComponents()函数

OpenCV中的cv2.connectedComponents()函数用于将图像中的背景标记为0，将其他图像标记为从1开始的整数，其基本格式如下：

ret, labels = cv2.connectedComponents(image[, connectivity[, ltype]])

labels为返回的标记结果图像, 和image大小一样

image为要标记的8位单通道图像

connectivity为4或8(默认值), 表示连接性

ltype为返回的标记结果图像的类型

# cv2.connectedComponents()函数，将图像中的背景标记为0，将其他图像标记为从1开始的整数
ret, imgfg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, cv2.THRESH_TRUNC)

imgfg = np.uint8(imgfg)

ret, markers = cv2.connectedComponents(imgfg)

plt.imshow(imgfg,cmap='gray')
plt.title('imgfg')
plt.axis('off')
plt.show()

plt.imshow(markers,cmap='gray')
plt.title('markers')
plt.axis('off')
plt.show()

3、cv2.watershed()函数

OpenCV中的cv2.watershed()函数用于执行分水岭算法分割图像，其基本格式如下：

ret = cv2.watershed(image, markers)

ret为返回的8位或32位单通道图像

image为输入的8位或32位单通道图像

markers为输入的32位单通道图像

# cv2.watershed()函数，执行分水岭算法分割图像
img = cv2.imread('qizi.jpg')

img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 灰度操作

ret, thresh = cv2.threshold(img_gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) 	# 阈值操作

kernel = np.ones((3, 3), np.uint8)
img_open = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations=2) 				# 形态学操作

img_dilate = cv2.dilate(img_open, kernel, iterations=3)               					# 膨胀操作(确定背景)

img_dist = cv2.distanceTransform(img_open, cv2.DIST_L2, 0)          

ret, img_fg = cv2.threshold(img_dist, 0.7*img_dist.max(), 255, 2)      					# 距离操作(确定前景)

img_fg = np.uint8(img_fg)

ret, markers = cv2.connectedComponents(img_fg)

unknown = cv2.subtract(img_dilate, img_fg)												# 确定位置未知区域

markers = markers + 1																	# 加1使背景不为0

markers[unknown == 255] = 0																# 将未知区域设置为0

img_water = cv2.watershed(img, markers)													# 执行分水岭算法

plt.imshow(img_water, cmap='gray')
plt.title('watershed')
plt.axis('off')
plt.show()

img[img_water == -1] = [0, 255, 0]														# 将原图中的被标记点设置为绿色
cv2.namedWindow('watershed', cv2.WINDOW_NORMAL)
cv2.imshow('watershed', img)

cv2.waitKey(0)
cv2.destroyAllWindows()

二、图像金字塔

图像金字塔从分辨率的角度分析处理图像。图像金字塔的底部为原始图，对原始图像进行梯次向下采样，得到金字塔的其他各层图像。层次越高，分辨率越低，图像越小。通常，每向上一层，图像的宽度和高度就为下一层的一半。常见的图像金字塔可分为高斯金字塔和拉普拉斯金字塔。

高斯金字塔有向上和向下两种采样方式。向下采样时，原始图像为第0层，第1次向下采样的结果为第1层，第2次向下采样的结果为第2层，以此类推。每次采样图像的宽度和高度都减小为原来的一半，所有的图层构成高斯金字塔。向上采样的过程和向下采样的过程相反，每次采样图像的宽度和高度都扩大为原来的二倍。

1、高斯金字塔向下采样

OpenCV中的cv2.pyrDown()函数用于执行高斯金字塔构造的向下采样步骤，其基本格式如下：

ret = cv2.pyrDown(image[, dstsize[, borderType]])

ret为返回的结果图像, 类型和输入图像相同

image为输入图像

dstsize为结果图像大小

borderType为边界类型

# 高斯金字塔向下采样
img = cv2.imread('qizi.jpg')
img1 = cv2.pyrDown(img)
img2 = cv2.pyrDown(img1)

cv2.imshow('img', img)
cv2.imshow('img1', img1)
cv2.imshow('img2', img2)

print('0层的形状：', img.shape)
print('1层的形状：', img1.shape)
print('2层的形状：', img2.shape)

cv2.waitKey(0)
cv2.destroyAllWindows()

2、高斯金字塔向上采样

OpenCV中的cv2.pyrUp()函数用于执行高斯金字塔构造的向下采样步骤，其基本格式如下：

ret = cv2.pyrUp(image[, dstsize[, borderType]])

ret为返回的结果图像, 类型和输入图像相同

image为输入图像

dstsize为结果图像大小

borderType为边界类型

3、拉普拉斯金字塔

拉普拉斯金字塔的第n层是该层高斯金字塔图像减去n+1层向上采样的结果获得的图像。

# 拉普拉斯金字塔
img = cv2.imread('qizi.jpg')
img1 = cv2.pyrDown(img)
img2 = cv2.pyrDown(img1)
img3 = cv2.pyrDown(img2)

imgL0 = cv2.subtract(img, cv2.pyrUp(img1))
imgL1 = cv2.subtract(img1, cv2.pyrUp(img2))
imgL2 = cv2.subtract(img2, cv2.pyrUp(img3))

cv2.imshow('imgL0', imgL0)
cv2.imshow('imgL1', imgL1)
cv2.imshow('imgL2', imgL2)

cv2.waitKey(0)
cv2.destroyAllWindows()

4、应用图像金字塔实现图像的分割和融合

# 应用图像金字塔实现图像融合
img1 = cv2.imread('jiang1.jpg')
img2 = cv2.imread('jiang2.jpg')

#生成图像1的高斯金字塔，向下采样6次
img = img1.copy()
img1Gaus = [img]
for i in range(6):
    img = cv2.pyrDown(img)
    img1Gaus.append(img)

#生成图像2的高斯金字塔，向下采样6次
img = img2.copy()
img2Gaus = [img]
for i in range(6):
    img = cv2.pyrDown(img)
    img2Gaus.append(img)

#生成图像1的拉普拉斯金字塔，6层
img1Laps = [img1Gaus[5]]
for i in range(5,0,-1):
    img = cv2.pyrUp(img1Gaus[i])
    lap = cv2.subtract(img1Gaus[i-1],img)    #两个图像大小不同时，做减法会出错
    img1Laps.append(lap)

#生成图像2的拉普拉斯金字塔，6层
img2Laps = [img2Gaus[5]]
for i in range(5,0,-1):
    img = cv2.pyrUp(img2Gaus[i])
    lap = cv2.subtract(img2Gaus[i-1],img)
    img2Laps.append(lap)

#拉普拉斯金字塔拼接：图像1每层左半部分与和图像2每层右半部分拼接
imgLaps = []
for la,lb in zip(img1Laps,img2Laps):
    rows,cols,dpt = la.shape
    ls=la.copy()
    ls[:,int(cols/2):]=lb[:,int(cols/2):]
    imgLaps.append(ls)

#从拉普拉斯金字塔恢复图像
img = imgLaps[0]
for i in range(1,6):
    img = cv2.pyrUp(img)
    img = cv2.add(img, imgLaps[i])

#图像1原图像的半部分与和图像2原图像的右左半部分直接拼接
direct = img1.copy()
direct[:,int(cols/2):]=img2[:,int(cols/2):]
cv2.imshow('Direct',direct)             #显示直接拼接结果
cv2.imshow('Pyramid',img)               #显示图像金字塔拼接结果
cv2.waitKey(0)
cv2.destroyAllWindows()

到此这篇关于OpenCV图像分割之分水岭算法与图像金字塔算法详解的文章就介绍到这了,更多相关OpenCV图像分割内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python opencv之分水岭算法示例

本文介绍了python opencv之分水岭算法示例,分享给大家,具体如下: 目标使用分水岭算法对基于标记的图像进行分割使用函数cv2.watershed() 原理: 灰度图像可以被看成拓扑平面,灰度值高的区域可以看出山峰,灰度值低的区域可以看成是山谷.向每一个山谷当中灌不同颜色的水.水位升高,不同山谷的水会汇合,为防止不同山谷的水汇合,小在汇合处建立起堤坝.然后继续灌水,然后再建立堤坝,直到山峰都掩模.构建好的堤坝就是图像的分割. 此方法通常会得到过渡分割的结果,因为图像中的噪声以及其他因
Opencv分水岭算法学习

分水岭算法可以将图像中的边缘转化成"山脉",将均匀区域转化为"山谷",这样有助于分割目标. 分水岭算法是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中的每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭.分水岭的概念和形成可以通过模拟浸入过程来说明:在每一个局部极小值表面,刺穿一个小孔,然后把整个模型慢慢浸入水中,随着浸入的加深,每一个局部极小值的影响区域慢慢向外扩展,
python数字图像处理之骨架提取与分水岭算法

骨架提取与分水岭算法也属于形态学处理范畴,都放在morphology子模块内. 1.骨架提取骨架提取,也叫二值图像细化.这种算法能将一个连通区域细化成一个像素的宽度,用于特征提取和目标拓扑表示. morphology子模块提供了两个函数用于骨架提取,分别是Skeletonize()函数和medial_axis()函数.我们先来看Skeletonize()函数. 格式为:skimage.morphology.skeletonize(image) 输入和输出都是一幅二值图像. 例1: from s
python 用opencv实现图像修复和图像金字塔

我们将学习如何通过一种称为修复的方法去除旧照片中的小噪音,笔画等.基本思路很简单:用相邻像素替换那些坏标记,使其看起来像邻域. cv2.inpaint() cv2.INPAINT_TELEA cv2.INPAINT_NS import numpy as np import cv2 as cv img = cv.imread('messi_2.jpg') mask = cv.imread('mask2.png',0) dst = cv.inpaint(img,mask,3,cv.INPAINT_T
Opencv实现用于图像分割分水岭算法

目标 • 使用分水岭算法基于掩模的图像分割 • 学习函数: cv2.watershed() 原理任何一幅灰度图像都可以被看成拓扑平面,灰度值高的区域可以被看成是山峰,灰度值低的区域可以被看成是山谷.我们向每一个山谷中灌不同颜色的水,随着水的位的升高,不同山谷的水就会相遇汇合,为了防止不同山谷的水汇合,我们需要在水汇合的地方构建起堤坝.不停的灌水,不停的构建堤坝直到所有的山峰都被水淹没.我们构建好的堤坝就是对图像的分割.这就是分水岭算法的背后哲理. 但是这种方法通常都会得到过度分割的结果
OpenCV-Python使用分水岭算法实现图像的分割与提取

随着当今世界的发展,计算机视觉技术的应用越来越广泛.伴随着硬件设备的不断升级,构造复杂的计算机视觉应用变得越来越容易了.OpenCV像是一个黑盒,让我们专注于视觉应用的开发,而不必过多的关注基础图象处理的具体细节. 图像分割了解分水岭算法之前,我们需要了解什么是图像的分割. 在图像的处理过程中,经常需要从图像中将前景对象作为目标图像分割或者提取出来.例如,在视频监控中,观测到的是固定背景下的视频内容,而我们对背景本身并无兴趣,感兴趣的是背景中出现的车辆,行人或者其他对象.我们希望将这些对象从视
OpenCV半小时掌握基本操作之分水岭算法

[OpenCV]⚠️高手勿入! 半小时学会基本操作 ⚠️ 分水岭算法概述 OpenCV 是一个跨平台的计算机视觉库, 支持多语言, 功能强大. 今天小白就带大家一起携手走进 OpenCV 的世界. 分水岭算法分水岭算法 (Watershed Algorithm) 是一种图像区域分割算法. 在分割的过程中, 分水岭算法会把跟临近像素间的相似性作为重要的根据. 分水岭分割流程: 读取图片转换成灰度图二值化距离变换寻找种子生成 Marker 分水岭变换距离变换距离变换 (Distan
OpenCV 图像金字塔的实现示例

目录 1.高斯金字塔 2.拉普拉斯金字塔本文主要介绍了OpenCV 图像金字塔,具有一定的参考价值,感兴趣的可以了解一下高斯金字塔reduce void cv::pyrDown() expand void cv::pyrUp() 1.高斯金字塔图像金字塔是对一张输入图像先模糊再下采样为原来的高.宽的1/2,不断重复模糊与下采样的过程就得到了不同分辨率的输出图像,叠加在一起就形成了图像金字塔. 高斯金字塔便是先进行高斯模糊,再进行reduce和expand操作.高斯金字塔中的较高级别(低分辨
OpenCV图像分割中的分水岭算法原理与应用详解

图像分割是按照一定的原则,将一幅图像分为若干个互不相交的小局域的过程,它是图像处理中最为基础的研究领域之一.目前有很多图像分割方法,其中分水岭算法是一种基于区域的图像分割算法,分水岭算法因实现方便,已经在医疗图像,模式识别等领域得到了广泛的应用. 1.传统分水岭算法基本原理分水岭比较经典的计算方法是L．Vincent于1991年在PAMI上提出的[1].传统的分水岭分割方法,是一种基于拓扑理论的数学形态学的分割方法,其基本思想是把图像看作是测地学上的拓扑地貌,图像中每一像素的灰度值表示该点的海
python计算机视觉opencv图像金字塔轮廓及模板匹配

目录 1.图像金字塔 ①高斯金字塔 ②拉普拉斯金字塔 2.图像轮廓 ①寻找轮廓 ②轮廓特征 ③轮廓绘制 3.模板匹配 ①模板匹配 ②匹配框线绘制 ③多对象匹配 4.直方图统计 ①直方图绘制 ②直方图统计 ③直方图的mask操作 ④直方图均衡化 5.傅里叶变换 1.图像金字塔 ①高斯金字塔向下采样,数据会越来越少,减少的方式是:将偶数行和列删除向上采样,数据会越来越多,将图像在每个方向上扩大为原来的两倍,新增的行和列用0来填充.使用先前同样的内核与放大后的图像卷积,获得近似值. 上采样之后,图