基于opencv的行人检测(支持图片视频)

2025-01-30 19:05:10

基于方向梯度直方图(HOG)/线性支持向量机(SVM)算法的行人检测方法中存在检测速度慢的问题，如下图所示，对一张400*490像素的图片进行检测要接近800毫秒，所以hog+svm的方法放在视频中进行行人检测时，每秒只能检测1帧图片，1帧/s根本不能达到视频播放的流畅性。

本文采用先从视频每帧的图像中提取出物体的轮廓（也可以对前后两针图片做差，只对有变化的部分进行检测，其目的一样，都是减少运算的面积），再对每个轮廓进行HOG+SVM检测，判断是否为行人。可以大大的缩减HOG+SVM的面积，经实测，检测速度可以达到10帧/S，可以勉强达到视频流畅的要求。

轮廓的提取用的是cv::findContours的API，感兴趣的可以自己去查看相关资料

首先介绍下方向梯度直方图。

在图像或者视频帧中，边缘方向密度分布可以很好地描述局部目标的形状和表象，也就是说通过 HOG特征，可以有效地将人体和复杂背景区分出来。对于行人检测中 HOG 特征提取的具体实现方法是: 将视频中的每一帧通过滑动窗口切割成很小的区域( Cell) ，通过计算每个区域面的方向梯度特征，得到每个区域的方向特征直方图，小区域再组成更大的区域，通过将区域的方向梯度特征组合起来并在块单元中进行归一化处理，就形成了一个 Block 内 HOG 描述子，遍历搜索所有的方向特征从而最终构成一个帧的 HOG 描述特征向量。算法的过程［3］分为:

①将一个视频的每一帧进行灰度化处理。把视频的每一帧彩色空间变成灰度空间，因为 HOG 中不需要彩色信息的帮助。

②对输入的视频的每一帧进行颜色空间的归一化。由于视频中人信息的复杂性，背影的灰暗程度以及光照的影响都对检测器的鲁棒性有一定的影响，归一化可以很大程度上降低这些的影响。这里使用gamma 校正: 对像素值求其平方根( 降低数值大小) 。

③计算像素梯度。这是 HOG 特征检测中最重要的一个环节，通过像素的梯度方向直方图来描述像素的特征。特别注意的是我们不需要做平滑处理，因为平滑处理的本质就是迷糊图像，降低了像素边缘信息，因而就不能很好地提取边缘信息来表达特征。

④将图像划分成小 cell。这一步我们需要为计算梯度，建立梯度方向直方图定义一个载体，因此这里把图像分割成很小的区域，这里称为细胞单元，实验表明6 × 6 像素的细胞单元效果最佳。接着采用 9 个直方图来统计一个细胞单元里面的特征信息。360°不考虑
正负方向，把方向分成 9 份，如图 1 所示，称为 bin，也就是每一个 bin 对应 20°，这样就把梯度方向映射到直方图里面，9 个方向特征向量代表 9 个 bin，增幅就代表每一个 bin 的权值。

⑤统计每个 cell 的梯度直方图即可形成每个 cell的 descriptor。

⑥将每几个 cell 组成一个 block，一个 block 内所有 cell 的特征串联起来，便得到该 block 的 HOG 特征descriptor。

⑦将图像内所有 block 的 HOG 特征收集起来就可得到该图像特征向量。

支持向量机

支持向量机( Support Vector Machine) 就是风险降低到最小程度上，寻找最优的解决方案。视频检测特征分类中，就是针对低维空间的线性不可分问题，通过核函数映射到高维空间达到线性可分，再进行线性分割实现特征分类。
SVM 具有以下几个特点:
( 1) 小样本。
( 2) 非线性问题。即针对线性的不可分问题，SVM 通过松弛变量以及核函数进行解决。
( 3) 高维模式识别。在某些样本，例如密集型特征，可以达到几万甚至十几万的维数，如果不对样本进行降维，SVM 也能够找出支持向量样本，对这些特征训练出优秀的分类器。

视频检测代码：

void video_test() {
	void display(Mat, vector<Rect>&);
	//void Crop_picture();
	//void train();
	//void save_hard_example();

	//Crop_picture();     //裁切负样本图片，每张负样本图片随机裁成10张
	//train();          //训练正负样本
	//save_hardexample()     //根据正负样本得到的检测子，对INRIAPerson/Train/neg/中的图片进行测试，并将错检的样本保存
	//train();      //训练正负样本及难例样本

	//加载svm分类器的系数
	HOGDescriptor hog; string str;
	vector<float> detector;
	/*ifstream fin("HOGDetectorForOpenCV.txt");
	while (getline(fin, str))
	{
		detector.push_back(stringToNum<float>(str));
	}
*/

	vector<Rect> people;
	VideoCapture capture(VideotestPath);
	/*if (!capture.isOpened())
	return -1;*/
	Mat frame, foreground;

	int num = 0;
	Ptr<BackgroundSubtractorMOG2> mod = createBackgroundSubtractorMOG2();

	while (true)
	{
		vector<Rect> rect6;
		if (!capture.read(frame))
		break;
		mod->apply(frame, foreground, 0.01);
		hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
		//hog.setSVMDetector(detector);
		vector<Rect> rect5;
		display(foreground, rect5);
		vector<Rect> ret = rect5;
		for (auto i = 0; i != ret.size(); i++)
		{
			Mat a = frame;

			if (ret[i].x > 50 && ret[i].y > 50 && ret[i].x + ret[i].width <670 && ret[i].y + ret[i].height < 520)
			{
				ret[i].x = ret[i].x - 50;
				ret[i].y = ret[i].y - 50; ret[i].width = ret[i].width + 100; ret[i].height = ret[i].height + 100;
			}
			Mat src(a(ret[i]));
			cout << ret[i].x << " " << ret[i].y << " " << ret[i].width << " " << ret[i].height << endl;
			// imshow("aa", src); waitKey(0);
			// cv::namedWindow("src", CV_WINDOW_NORMAL); 

			if (ret[i].width >= 64 && ret[i].height >= 128)

				hog.detectMultiScale(src, people, 0, Size(4, 4), Size(0, 0), 1.07, 2);
			//cout << people.size()<<endl;
			for (size_t j = 0; j < people.size(); j++)
			{
				people[j].x += ret[i].x; people[j].y += ret[i].y;
				rect6.push_back(people[j]);
				//rectangle(frame, people[j], cv::Scalar(0, 0, 255), 2);
			}
			//imshow(" ", frame); waitKey(0);

		}
		//因为多尺度检测得到的结果矩形框较大，按比例缩减矩形框
		for (auto h = 0; h != rect6.size(); h++)
		{
			rect6[h].x += cvRound(rect6[h].width*0.1);
			rect6[h].width = cvRound(rect6[h].width*0.8);
			rect6[h].y += cvRound(rect6[h].height*0.07);
			rect6[h].height = cvRound(rect6[h].height*0.8);
			rectangle(frame, rect6[h], cv::Scalar(0, 0, 255), 1);
			//rect2[h] = boundingRect(frame);
		}
		imshow(" ", frame); waitKey(1);
	}
	waitKey();
}

提取轮廓的代码：

void display(Mat gray_diff, vector<Rect>& rect)
{
	//Mat res = src.clone();
	vector<vector<Point>> cts;  //定义轮廓数组
	findContours(gray_diff, cts, CV_RETR_EXTERNAL, CV_CHAIN_APPROX_NONE); //查找轮廓,，模式为只检测外轮廓，并存储所有的轮廓点
																		  //vector<Rect> rect; //定义矩形边框
	for (int i = 0; i < cts.size(); i++)
	{
		if (contourArea(cts[i])>th_area)       //计算轮廓的面积，排除小的干扰轮廓

			  //查找外部矩形边界
			rect.push_back(boundingRect(cts[i]));   //计算轮廓的垂直边界最小矩形

	}
	cout << rect.size() << endl;     //输出轮廓个数
}

检测效果：

进行HOG+SVM的四个顶点像素坐标。可以看到每次运算的面积小了很多。

当然，是可以优化，比如每两帧图片检测一次，下一帧图片保持上一帧的检测结果。比如轮廓区域的面积怎么去合适的框起来，如何设定合适的阈值去滤掉小框，两个框重叠时，怎么去优化，减小进行运算的面积。本文只是给个思路，具体读者可以自己去实现。

贴下github 有兴趣的可以去读下，样本集用的INRIA行人检测数据集，训练过程就不详述了。

github：https://github.com/ttttthub/pedestrian-detection.git

到此这篇关于基于opencv的行人检测(支持图片视频)的文章就介绍到这了,更多相关opencv 行人检测内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

python+opencv3.4.0 实现HOG+SVM行人检测的示例代码

参照opencv官网例程写了一个基于python的行人检测程序,实现了和自带检测器基本一致的检测效果. 网址 :https://docs.opencv.org/3.4.0/d5/d77/train_HOG_8cpp-example.html opencv版本:3.4.0 训练集和opencv官方用了同一个,可以从http://pascal.inrialpes.fr/data/human/下载,在网页的最下方"here(970MB处)",用迅雷下载比较快(500kB/s).训练集文件比较
Python+OpenCV内置方法实现行人检测

您是否知道 OpenCV 具有执行行人检测的内置方法? OpenCV 附带一个预训练的 HOG + 线性 SVM 模型,可用于在图像和视频流中执行行人检测. 今天我们使用Opencv自带的模型实现对视频流中的行人检测,只需打开一个新文件,将其命名为 detect.py ,然后加入代码: # import the necessary packages from __future__ import print_function import numpy as np import argparse i
基于opencv的行人检测(支持图片视频)

基于方向梯度直方图(HOG)/线性支持向量机(SVM)算法的行人检测方法中存在检测速度慢的问题,如下图所示,对一张400*490像素的图片进行检测要接近800毫秒,所以hog+svm的方法放在视频中进行行人检测时,每秒只能检测1帧图片,1帧/s根本不能达到视频播放的流畅性. 本文采用先从视频每帧的图像中提取出物体的轮廓(也可以对前后两针图片做差,只对有变化的部分进行检测,其目的一样,都是减少运算的面积),再对每个轮廓进行HOG+SVM检测,判断是否为行人.可以大大的缩减HOG+SVM的面积,经实
Python基于OpenCV实现人脸检测并保存

本文实例为大家分享了Python基于OpenCV实现人脸检测,并保存的具体代码,供大家参考,具体内容如下安装opencv 如果安装了pip的话,Opencv的在windows的安装可以直接通过cmd命令pip install opencv-python(只需要主要模块),也可以输入命令pip install opencv-contrib-python(如果需要main模块和contrib模块) 详情可以点击此处导入opencv import cv2 所有包都包含haarcascade文件.这
Python机器视觉之基于OpenCV的手势检测

目录 1 简介 2 传统机器视觉的手势检测 2.1 轮廓检测法 2.2 算法结果 2.3 整体代码实现 3 深度学习方法做手势识别 3.1 经典的卷积神经网络 3.2 YOLO系列 3.3 SSD 3.4 实现步骤 3.5 关键代码 4 实现手势交互 1 简介今天学长向大家介绍一个机器视觉项目基于机器视觉opencv的手势检测手势识别算法 2 传统机器视觉的手势检测普通机器视觉手势检测的基本流程如下: 其中轮廓的提取,多边形拟合曲线的求法,凸包集和凹陷集的求法都是采用opencv中自带
Python基于Opencv识别两张相似图片

在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系. 当然了,图像识别这个话题作为计算机科学的一个分支,不可能就在本文简单几句就说清,所以本文只作基本算法的科普向. 看到一篇博客是介绍这个,但他用的是PIL中的Image实现的,感觉比较麻烦,于是利用Opencv库进行了更简洁化的实现. 相关背景要识别两张相似图像,我们从感性上来谈是怎么样的一个过程?首先我们会区分这两张相片的类型,例如是风景照,还是人物照.风景照中
基于openCV实现人脸检测

openCV的人脸识别主要通过Haar分类器实现,当然,这是在已有训练数据的基础上.openCV安装在 opencv/opencv/sources/data/haarcascades_cuda(或haarcascades)中存在预先训练好的物体检测器(xml格式),包括正脸.侧脸.眼睛.微笑.上半身.下半身.全身等. openCV的的Haar分类器是一个监督分类器,首先对图像进行直方图均衡化并归一化到同样大小,然后标记里面是否包含要监测的物体.它首先由Paul Viola和Michael Jon
Python基于opencv调用摄像头获取个人图片的实现方法

接触图像领域的应该对于opencv都不会感到陌生,这个应该算是功能十分强劲的一个算法库了,当然了,使用起来也是很方便的,之前使用Windows7的时候出现多该库难以安装成功的情况,现在这个问题就不存在了,需要安装包的话可以去我的资源中下载使用,使用pip安装方式十分地便捷. 今天主要是基于opencv模块来调用笔记本的内置摄像头,然后从视频流中获取到人脸的图像数据用于之后的人脸识别项目,也就是为了构建可用的数据集.整个实现过程并不复杂,具体如下: #!usr/bin/env python #en
OpenCV实现人脸检测

前段日子,写了个人脸检测的小程序,可以检测标记图片.视频.摄像头中的人脸.效果还行吧,用的是opencv提供人脸库.至于具体的人脸检测原理,找资料去啃吧. 环境:VS2013+OPENCV2.4.10+Win8.1 一.基于对话框的MFC 首先,新建一个基于对话框的MFC应用程序,命名为myFaceDetect(取消"安全开发周期(SDL)检查"勾选,我自己习惯取消这个). 放置Button,设置Button的ID和Caption. 图片按钮--ID:IDC_FACEDETECT 视频
C++利用opencv实现人脸检测

小编所有的帖子都是基于unbuntu系统的,当然稍作修改同样试用于windows的,经过小编的绞尽脑汁,把刚刚发的那篇python 实现人脸和眼睛的检测的程序用C++ 实现了,当然,也参考了不少大神的博客,下面我们就一起来看看: Linux系统下安装opencv我就再啰嗦一次,防止有些人没有安装没调试出来喷小编的程序是个坑, sudo apt-get install libcv-dev sudo apt-get install libopencv-dev 看看你的usr/share/opencv
Python基于OpenCV实现视频的人脸检测

本文实例为大家分享了基于OpenCV实现视频的人脸检测具体代码,供大家参考,具体内容如下前提条件 1.摄像头 2.已安装Python和OpenCV3 代码 import cv2 import sys import logging as log import datetime as dt from time import sleep cascPath = "haarcascade_frontalface_default.xml" faceCascade = cv2.CascadeCla

基于opencv的行人检测(支持图片视频)

支持向量机

视频检测代码：

相关推荐

随机推荐