C++ OpenCV单峰三角阈值法Thresh_Unimodal详解

2025-01-29 05:44:36

需求说明

在对图像进行处理时，经常会有这类需求：想通过阈值对图像进行二值化分割，以提取自己感兴趣的区域，常见的阈值分割方法有常数分割、最大类间方差法、双峰分割、三角法等等，不同的场景应用不同的阈值方法。

今天要讲的方法，适合当图像的直方图具有明显单峰特征时使用，结合了三角法的原理而设计，相比较OpenCV自带的三角法，好处是可以根据自身需求合理修改函数；如果用OpenCV库的函数，只有一个接口，若不能达到较理想的应用效果，就束手无策了。

下面介绍具体实现流程。

具体流程

1）取图像的灰度图，并遍历统计0-255各个灰度值所出现的次数。

cv::Mat src = imread("test.jpg", 0);
cv::Mat hist = cv::Mat::zeros(1, 256, CV_32FC1);
for (int i = 0; i < src.rows; ++i)
{
	for (int j = 0; j < src.cols; ++j)
	{
		hist.at<float>(0, src.at <uchar>(i, j))++;
	}
}

2）去除0和255的直方图数据，这一步就是OpenCV三角法所没有的。很多人可能不理解为什么要这一步，在你对图像进行阈值化时如果提前进行了相关的运算，可能导致结果大于255的数值全部变为255，或者数值低于0的数值全部变为0，这就使得0和255的数值其实涵盖了许多数值，呈累加态，很容易形成双峰，这样就很难找到我们真正想要的峰。例如0和255的数值都是10000左右,0略大一些，而我们的真峰是在250左右的灰度值，数值只有8000多，那么在后续阈值计算时就会因为峰的方向错了而带来毁灭性打击。别觉得我说夸张了，只有自己去碰碰壁才能深刻领悟我说的。

hist.at<float>(0, 255) = 0;
hist.at<float>(0, 0) = 0;

3）确认峰值位置，maxidx是峰值对应的灰度值，max是峰值高度，也是灰度值对应数据的个数。

float max = 0;
int maxidx = 0;
for (int i = 0; i < 256; ++i)
{
	if (hist.at<float>(0, i) > max)
	{
		max = hist.at<float>(0, i);
		maxidx = i;
	}
}

4）判断峰值在左侧还是右侧，true为左侧，false为右侧。

bool lr = maxidx < 127;

5）当在左侧时，连接峰值(maxidx,max)和(255,0)点，用两点建立直线公式，如下图所示公式。 L的表达式可以转换为Ax+By+C=0的形式，A是-max，B是maxidx-255，C是max*255，在结合距离公式可以计算出直方图曲线上每个点到直线的距离，取距离最长的那个点作为阈值。

if (lr)
{
	float A = float(-max);
	float B = float(maxidx - 255);
	float C = float(max * 255);

	for (int i = maxidx + 1; i < 256; ++i)
	{
		float x0 = float(i);
		float y0 = hist.at<float>(0, i);
		float d = abs(A * x0 + B * y0 + C) / std::sqrt(A * A + B * B);
		if (d > maxd)
		{
			maxd = d;
			maxdidx = i;
		}
	}
}

6）右侧同理，连接峰值(maxidx,max)和(0,0)点，公式ABC如代码所示。

else {
	float A = float(-max);
	float B = float(maxidx);
	float C = 0.0f;

	for (int i = 0; i < maxidx; ++i)
	{
		float x0 = float(i);
		float y0 = hist.at<float>(0, i);
		float d = abs(A * x0 + B * y0 + C) / std::sqrt(A * A + B * B);
		if (d > maxd)
		{
			maxd = d;
			maxdidx = i;
		}
	}
}

7）二值化，完成。

result.setTo(255, src > maxdidx);
idx = maxdidx;
return result;

功能函数

// 单峰三角阈值法
cv::Mat Thresh_Unimodal(cv::Mat &src, int& idx)
{
	cv::Mat result = cv::Mat::zeros(src.size(), CV_8UC1);

	// 统计直方图
	cv::Mat hist = cv::Mat::zeros(1, 256, CV_32FC1);
	for (int i = 0; i < src.rows; ++i)
	{
		for (int j = 0; j < src.cols; ++j)
		{
			hist.at<float>(0, src.at<uchar>(i, j))++;
		}
	}
	hist.at<float>(0, 255) = 0;
	hist.at<float>(0, 0) = 0;
	// 搜索最大值位置
	float max = 0;
	int maxidx = 0;
	for (int i = 0; i < 256; ++i)
	{
		if (hist.at<float>(0, i) > max)
		{
			max = hist.at<float>(0, i);
			maxidx = i;
		}
	}
	// 判断最大点在哪一侧，true为左侧，false为右侧
	bool lr = maxidx < 127;

	float maxd = 0;
	int maxdidx = 0;
	// 假设在左侧
	if (lr)
	{
		float A = float(-max);
		float B = float(maxidx - 255);
		float C = float(max * 255);

		for (int i = maxidx + 1; i < 256; ++i)
		{
			float x0 = float(i);
			float y0 = hist.at<float>(0, i);
			float d = abs(A * x0 + B * y0 + C) / std::sqrt(A * A + B * B);
			if (d > maxd)
			{
				maxd = d;
				maxdidx = i;
			}
		}
	}
	// 假设在右侧
	else {
		float A = float(-max);
		float B = float(maxidx);
		float C = 0.0f;

		for (int i = 0; i < maxidx; ++i)
		{
			float x0 = float(i);
			float y0 = hist.at<float>(0, i);
			float d = abs(A * x0 + B * y0 + C) / std::sqrt(A * A + B * B);
			if (d > maxd)
			{
				maxd = d;
				maxdidx = i;
			}
		}
	}

	// 二值化
	result.setTo(255, src > maxdidx);
	idx = maxdidx;
	return result;
}

C++测试代码

#include <iostream>
#include <time.h>
#include <opencv2/opencv.hpp>

using namespace std;
using namespace cv;

cv::Mat DrawHistImg(cv::Mat &hist);
cv::Mat Thresh_Unimodal(cv::Mat &src, int& idx);

int main()
{
	cv::Mat src = imread("test.jpg", 0);

	// 绘制均衡化后直方图
	cv::Mat hrI = DrawHistImg(src);

	// 单峰三角阈值法
	int thresh;
	cv::Mat result = Thresh_Unimodal(src, thresh);

	cout << " thresh: " << thresh << endl;

	imshow("original", src);
	imshow("hist", hrI);
	imshow("result", result);
	waitKey(0);

	return 0;
}

// 绘制简易直方图
cv::Mat DrawHistImg(cv::Mat &src)
{
	cv::Mat hist = cv::Mat::zeros(1, 256, CV_32FC1);
	for (int i = 0; i < src.rows; ++i)
	{
		for (int j = 0; j < src.cols; ++j)
		{
			hist.at<float>(0, src.at <uchar>(i, j))++;
		}
	}
	cv::Mat histImage = cv::Mat::zeros(540, 1020, CV_8UC1);
	const int bins = 255;
	double maxValue;
	cv::Point2i maxLoc;
	cv::minMaxLoc(hist, 0, &maxValue, 0, &maxLoc);
	int scale = 4;
	int histHeight = 540;

	for (int i = 0; i < bins; i++)
	{
		float binValue = (hist.at<float>(i));
		int height = cvRound(binValue * histHeight / maxValue);
		cv::rectangle(histImage, cv::Point(i * scale, histHeight),
			cv::Point((i + 1) * scale - 1, histHeight - height), cv::Scalar(255), -1);

	}
	return histImage;
}

// 单峰三角阈值法
cv::Mat Thresh_Unimodal(cv::Mat &src, int& idx)
{
	cv::Mat result = cv::Mat::zeros(src.size(), CV_8UC1);

	// 统计直方图
	cv::Mat hist = cv::Mat::zeros(1, 256, CV_32FC1);
	for (int i = 0; i < src.rows; ++i)
	{
		for (int j = 0; j < src.cols; ++j)
		{
			hist.at<float>(0, src.at<uchar>(i, j))++;
		}
	}
	hist.at<float>(0, 255) = 0;
	hist.at<float>(0, 0) = 0;
	// 搜索最大值位置
	float max = 0;
	int maxidx = 0;
	for (int i = 0; i < 256; ++i)
	{
		if (hist.at<float>(0, i) > max)
		{
			max = hist.at<float>(0, i);
			maxidx = i;
		}
	}
	// 判断最大点在哪一侧，true为左侧，false为右侧
	bool lr = maxidx < 127;

	float maxd = 0;
	int maxdidx = 0;
	// 假设在左侧
	if (lr)
	{
		float A = float(-max);
		float B = float(maxidx - 255);
		float C = float(max * 255);

		for (int i = maxidx + 1; i < 256; ++i)
		{
			float x0 = float(i);
			float y0 = hist.at<float>(0, i);
			float d = abs(A * x0 + B * y0 + C) / std::sqrt(A * A + B * B);
			if (d > maxd)
			{
				maxd = d;
				maxdidx = i;
			}
		}
	}
	// 假设在右侧
	else {
		float A = float(-max);
		float B = float(maxidx);
		float C = 0.0f;

		for (int i = 0; i < maxidx; ++i)
		{
			float x0 = float(i);
			float y0 = hist.at<float>(0, i);
			float d = abs(A * x0 + B * y0 + C) / std::sqrt(A * A + B * B);
			if (d > maxd)
			{
				maxd = d;
				maxdidx = i;
			}
		}
	}

	// 二值化
	result.setTo(255, src > maxdidx);
	idx = maxdidx;
	return result;
}

测试效果

图1 原图灰度图

图2 直方图

图3 阈值图

图4 阈值结果

通过imagewatch插件可以观察阈值203是不是在距离最远的位置，答案是肯定的。

如果函数有什么可以改进完善的地方，非常欢迎大家指出，一同进步何乐而不为呢~

以上就是C++ OpenCV单峰三角阈值法Thresh_Unimodal详解的详细内容，更多关于C++ OpenCV单峰三角阈值法的资料请关注我们其它相关文章！

Python下opencv图像阈值处理的使用笔记

图像的阈值处理一般使得图像的像素值更单一.图像更简单.阈值可以分为全局性质的阈值,也可以分为局部性质的阈值,可以是单阈值的也可以是多阈值的.当然阈值越多是越复杂的.下面将介绍opencv下的三种阈值方法. (一)简单阈值简单阈值当然是最简单,选取一个全局阈值,然后就把整幅图像分成了非黑即白的二值图像了.函数为cv2.threshold() 这个函数有四个参数,第一个原图像,第二个进行分类的阈值,第三个是高于(低于)阈值时赋予的新值,第四个是一个方法选择参数,常用的有: cv2.THRESH_B
python opencv 简单阈值算法的实现

本文先了解一个简单阈值函数,以了解一个阈值算法的具体参数. 然后比较不同阈值函数的区别. 同样的,先用一副图说明本文重要大纲: #! usr/bin/env python # coding: utf-8 import cv2 img = cv2.imread('cat.jpg') img = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) # 先将图像矩阵进行二值化 # img = cv2.imread('cat.jpg',0) # 也可以直接将图像用灰度值读入,其中0
opencv提取轮廓大于某个阈值的图像

本文实例为大家分享了opencv提取轮廓大于某个阈值的图像,供大家参考,具体内容如下 #include "stdafx.h" #include "cv.h" #include "highgui.h" #include "stdio.h" #include"core/core.hpp" #include "opencv2/highgui/highgui.hpp" #include &quo
OpenCV实现普通阈值

普通阈值阈值本质上就是对图像进行分割的一个过程.利用阈值二值化可对灰度或彩色图像进行像素数据分类.普通阈值即阈值二值化就是针对给定的图像,以T作为阈值进行分割的过程.在OpenCV中该类的实现依赖于threshold() 函数.下面是该函数的声明: threshold(src, dst, thresh, maxval, type); 各参数解释 ·src 表示此操作的源(输入图像)的Mat对象. ·mat 表示目标(输出)图像的类Mat的对象. ·thresh 表示阈值T. ·maxval 表
OpenCV实现反阈值二值化

反阈值二值化反阈值二值化与阈值二值化互为逆操作.在OpenCV中该类的实现依赖于threshold() 函数.下面是该函数的声明: threshold(src, dst, thresh, maxval, type); 各参数解释 ·src 表示此操作的源(输入图像)的Mat对象. ·mat 表示目标(输出)图像的类Mat的对象. ·thresh 表示阈值T. ·maxval 表示最大灰度值,一般为255. ·type 表示要使用的阈值类型的整数类型变量,反阈值二值化为Imgproc.THRES
利用OpenCV实现局部动态阈值分割

利用OpenCV实现局部动态阈值分割,参考Halcon dyn_threshold算子的思路实现. #include "dialog.h" #include <QApplication> #include "cv.h" #include "highgui.h" #include <QDebug> int main(int argc, char *argv[]) { IplImage *img = cvLoadImage(&
python+opencv实现阈值分割

最近老师留了几个作业,虽然用opencv很简单一句话就出来了,但是还没用python写过.在官方文档中的tutorial中的threshold里,看到可以创建两个滑动条来选择type和value,决定用python实现一下注意python中的全局变量,用global声明开始出现了一些问题,因为毁掉函数每次只能传回一个值,所以每次只能更新value,后来就弄了两个毁掉函数,这个时候,又出现了滑动其中一个,另一个的值就会变为默认值的情况,这个时候猜想是全局变量的问题,根据猜想改动之后果然是. 感
opencv 阈值分割的具体使用

阈值分割像素图原始图像像素图见下面红色线:标注一条阈值线二进制阈值化首先设定一条阀值线如127 大于127的像素点灰度值设为最大(如unit8的格式为255) 小于127的像素点灰度值设为0 反二进制阈值化首先设定一条阀值线如127 大于127的像素点灰度值设为最小为0 小于127的像素点灰度值设为最大(如unit8的格式为255) 截断阈值化首先选定一个阀值,大于该阈值的像素点呗设定为该阈值,小于该阈值的不变如:阈值127,大于127的像素点值为127:小于127的不变
C++ OpenCV单峰三角阈值法Thresh_Unimodal详解

目录需求说明具体流程功能函数 C++测试代码测试效果需求说明在对图像进行处理时,经常会有这类需求:想通过阈值对图像进行二值化分割,以提取自己感兴趣的区域,常见的阈值分割方法有常数分割.最大类间方差法.双峰分割.三角法等等,不同的场景应用不同的阈值方法. 今天要讲的方法,适合当图像的直方图具有明显单峰特征时使用,结合了三角法的原理而设计,相比较OpenCV自带的三角法,好处是可以根据自身需求合理修改函数:如果用OpenCV库的函数,只有一个接口,若不能达到较理想的应用效果,就束手无策了
Python OpenCV实现图片预处理的方法详解

目录一.图片预处理 1.1 边界填充(padding) 1.2 融合图片(mixup) 1.3 图像阈值二.滤波器 2.1 均值滤波器 2.2 方框滤波器 2.3 高斯滤波器 2.4 中值滤波 2.5 所有滤波器按照上述顺序输出一.图片预处理 1.1 边界填充(padding) 方法 : cv2.copyMakeBorder BORDER_REPLICATE:复制法,也就是复制最边缘像素. BORDER_REFLECT:反射法,对感兴趣的图像中的像素在两边进行复制例如:fedcba|abc
Python OpenCV实现识别信用卡号教程详解

目录通过与 OpenCV 模板匹配的 OCR 信用卡 OCR 结果总结今天的博文分为三个部分. 在第一部分中,我们将讨论 OCR-A 字体,这是一种专为辅助光学字符识别算法而创建的字体. 然后我们将设计一种计算机视觉和图像处理算法,它可以: 本地化信用卡上的四组四位数字. 提取这四个分组中的每一个,然后单独分割 16 个数字中的每一个. 使用模板匹配和 OCR-A 字体识别 16 个信用卡数字中的每一个. 最后,我们将看一些将信用卡 OCR 算法应用于实际图像的示例. 通过与 OpenCV
利用OpenCV实现YOLO对象检测方法详解

目录前言什么是YOLO物体检测器? 项目结构检测图像检测视频前言本文将教你如何使用YOLOV3对象检测器.OpenCV和Python实现对图像和视频流的检测.用到的文件有yolov3.weights.yolov3.cfg.coco.names,这三个文件的github链接如下: GitHub - pjreddie/darknet: Convolutional Neural Networks https://pjreddie.com/media/files/yolov3.weights
Python图像运算之图像阈值化处理详解

目录一.图像阈值化二.固定阈值化处理 1.二进制阈值化 2.反二进制阈值化 3.截断阈值化 4.阈值化为0 5.反阈值化为0 三.自适应阈值化处理四.总结一.图像阈值化图像阈值化(Binarization)旨在剔除掉图像中一些低于或高于一定值的像素,从而提取图像中的物体,将图像的背景和噪声区分开来. 灰度化处理后的图像中,每个像素都只有一个灰度值,其大小表示明暗程度.阈值化处理可以将图像中的像素划分为两类颜色,常见的阈值化算法如公式(1)所示: 当某个像素点的灰度Gray(i,j)小于
C# OpenCV实现形状匹配的方法详解

1. 多角度模板匹配测试效果如下图: 图1-1 图1-2 图1-3 正负角度均可正常识别,识别角度偏差<1° 2. 下面分享一下开发过程: a). ROI区域的生成,基于GDI+完成图形绘制,如图绘制模板设置区域,用来生成需要的模板特征. ROI区域绘制代码如下: /// <summary> /// 区域绘制 /// </summary> /// <param name="graphics"></param> /// <pa
浅谈Python Opencv中gamma变换的使用详解

伽马变换就是用来图像增强,其提升了暗部细节,简单来说就是通过非线性变换,让图像从暴光强度的线性响应变得更接近人眼感受的响应,即将漂白(相机曝光)或过暗(曝光不足)的图片,进行矫正. 伽马变换的基本形式如下: 大于1时,对图像的灰度分布直方图具有拉伸作用(使灰度向高灰度值延展),而小于1时,对图像的灰度分布直方图具有收缩作用(是使灰度向低灰度值方向靠拢). #分道计算每个通道的直方图 img0 = cv2.imread('12.jpg') hist_b = cv2.calcHist([img0],
python 回溯法模板详解

什么是回溯法回溯法(探索与回溯法)是一种选优搜索法,又称为试探法,按选优条件向前搜索,以达到目标.但当探索到某一步时,发现原先选择并不优或达不到目标,就退回一步重新选择,这种走不通就退回再走的技术为回溯法,而满足回溯条件的某个状态的点称为"回溯点". 无重复元素全排列问题给定一个所有元素都不同的list,要求返回list元素的全排列. 设n = len(list),那么这个问题可以考虑为n叉树,对这个树进行dfs,这个问题里的回溯点就是深度(也就是templist的长度)为n时,回
R语言时间序列TAR阈值自回归模型示例详解

为了方便起见,这些模型通常简称为TAR模型.这些模型捕获了线性时间序列模型无法捕获的行为,例如周期,幅度相关的频率和跳跃现象.Tong和Lim(1980)使用阈值模型表明,该模型能够发现黑子数据出现的不对称周期性行为. 一阶TAR模型的示例: σ是噪声标准偏差,Yt-1是阈值变量,r是阈值参数, {et}是具有零均值和单位方差的iid随机变量序列. 每个线性子模型都称为一个机制.上面是两个机制的模型. 考虑以下简单的一阶TAR模型: #低机制参数 i1 = 0.3 p1 = 0.5 s1 = 1
Python OpenCV对图像进行模糊处理详解流程

其实我们平时在深度学习中所说的卷积操作,在 opencv 中也可以进行,或者说是类似操作.那么它是什么操作呢?它就是图像的模糊(滤波)处理. 均值滤波使用 opencv 中的cv2.blur(src, ksize)函数.其参数说明是: src: 原图像 ksize: 模糊核大小原理:它只取内核区域下所有像素的平均值并替换中心元素.3x3 标准化的盒式过滤器如下所示: 特征:核中区域贡献率相同. 作用:对于椒盐噪声的滤除效果比较好. # -*-coding:utf-8-*- ""&q