超详细注释之OpenCV Haar级联检测器进行面部检测

目录
  • 1. 效果图
  • 2. 原理
    • 2.1 Haar级联是什么?
    • 2.2 Haar级联的问题与局限性
    • 2.3 Haar级联预训练的模型
  • 3. 源码
    • 3.1 图像检测
    • 3.2 实时视频流检测
  • 参考

这篇博客将介绍如何使用预训练好的OpenCV Haar级联人脸、眼睛、嘴部检测器,并将它们应用于图片及实时视频流的检测。

人脸检测结果是最稳定和准确的。不幸的是,在许多情况下,眼睛检测和嘴巴检测结果是不可用的——对于面部特征/部分提取,强烈建议使用python,dlib,OpenCV提取眼睛,鼻子,嘴唇及下颌,dlib的检测要比眼睛Haar级联,嘴巴Haar级联本身更稳定,甚至更快。

Haar级联算法是OpenCV最流行的目标检测算法,主要优点是速度太快了,尽管许多算法(如HOG+线性SVM、SSDs、更快的R-CNN、YOLO等等)比Haar级联算法更精确。但如果需要纯粹的速度,就是无法打败OpenCV的Haar cascades。

Haar Cascades尤其是在资源受限的设备中工作时,当无法使用更昂贵的计算对象检测器时,效果显著。Haar级联的缺点是容易出现假阳性检测,应用于推理/检测时需要进行参数调整。

1. 效果图

Haar级联检测的效果如下:

可以看到图中有固定大小的面在移动,就可以“训练”分类器来识别图像的给定区域是否包含人脸。

面部、眼睛、嘴部检测效果图如下:

有时候会有假阳性结果,如下图:
可以看到检测并不是最准确的,脸部是准确的,但嘴和眼睛级联发生好几个假阳性。当眨眼时,有两种情况发生:(1)眼睛区域不再被检测到,或者(2)它被错误地标记为嘴巴,在许多帧中往往有多个嘴巴检测结果。

2. 原理

2.1 Haar级联是什么?

Haar级联检测5个特征:边缘特征、线特征、四角-矩形的特征,计算特征需要从黑色区域下的像素总和中减去白色区域下的像素总和。有趣的是,这些特征在人脸检测中具有实际的重要性:

  • 眼睛区域往往比脸颊区域暗。
  • 鼻子区域比眼睛区域亮。

给定这五个矩形区域及其相应的和差,就可以形成能够对人脸的各个部分进行分类的特征。

Haar级联的一些好处是,由于使用了积分图像(也称为求和面积表),它们在计算类似Haar的特征时非常快。通过使用AdaBoost算法,它们对特征选择也非常有效。最重要的是,它们可以检测图像中的人脸,而不考虑人脸的位置或比例。

2.2 Haar级联的问题与局限性

Haar级联检测器的问题与局限主要有3点:

  1. 需要最有效的正面图像的脸;
  2. 容易出现误报——Viola-Jones算法可以在没有人脸的情况下轻松报告图像中的人脸;
  3. 调优OpenCV检测参数会非常乏味。有时可以检测出图像中的所有人脸,有时会(1)图像的区域被错误地分类为面部;(2)面部被完全遗漏时。

2.3 Haar级联预训练的模型

OpenCV库维护一个预先训练好的Haar级联库。包括:

  • haarcascade_frontalface_default.xml:检测面部
  • haarcascade_eye.xml:检测左眼和右眼
  • haarcascade_smile.xml:检测面部是否存在嘴部
  • haarcascade_eye_tree_eyeglasses.xml:检测是否带墨镜🕶
  • haarcascade_frontalcatface.xml:检测猫脸
  • haarcascade_frontalcatface_extended.xml:检测猫脸延伸
  • haarcascade_frontalface_alt.xml:检测猫脸属性
  • haarcascade_frontalface_alt_tree.xml
  • haarcascade_frontalface_alt2.xml
  • haarcascade_fullbody.xml:检测全身
  • haarcascade_lefteye_2splits.xml:检测左眼
  • haarcascade_licence_plate_rus_16stages.xml:检测证件
  • haarcascade_lowerbody.xml:检测下半身
  • haarcascade_profileface.xml
  • haarcascade_righteye_2splits.xml:检测右眼
  • haarcascade_russian_plate_number.xml:检测俄罗斯字母车牌号
  • haarcascade_upperbody.xml:检测上半身

还提供了其他经过预训练的Haar级联,包括一个用于俄罗斯牌照,另一个用于猫脸检测。

可以使用cv2.CascadeClassifer从磁盘加载预先训练好的Haar级联检测器:

detector = cv2.CascadeClassifier(path)

可以使用detectMultiScale对其进行预测:

 results = detector.detectMultiScale(
		   gray, scaleFactor=1.05, minNeighbors=5,
		   minSize=(30, 30), flags=cv2.CASCADE_SCALE_IMAGE)

3. 源码

3.1 图像检测

# USAGE
# python opencv_haar_cascades_images.py --cascades cascades --image ml.jpg

# 导入必要的包
import argparse
import os  # 不同系统路径分隔符

import cv2  # opencv绑定
import imutils

# 构建命令行参数及解析
# --cascades 级联检测器的路径
ap = argparse.ArgumentParser()
ap.add_argument("-c", "--cascades", type=str, default="cascades",
                help="path to input directory containing haar cascades")
ap.add_argument("-i", "--image", type=str, default="ml2.jpg",
                help="path to input image")
args = vars(ap.parse_args())

# 初始化字典,并保存Haar级联检测器名称及文件路径
detectorPaths = {
    "face": "haarcascade_frontalface_default.xml",
    "eyes": "haarcascade_eye.xml",
    "smile": "haarcascade_smile.xml",
}

# 初始化字典以保存多个Haar级联检测器
print("[INFO] loading haar cascades...")
detectors = {}

# 遍历检测器路径
for (name, path) in detectorPaths.items():
    # 加载Haar级联检测器并保存到map
    path = os.path.sep.join([args["cascades"], path])
    detectors[name] = cv2.CascadeClassifier(path)

# 从磁盘读取图像,缩放,并转换灰度图
print(args['image'])
image = cv2.imread(args["image"])
image = imutils.resize(image, width=500)
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 使用合适的Haar检测器执行面部检测
faceRects = detectors["face"].detectMultiScale(
    gray, scaleFactor=1.05, minNeighbors=5, minSize=(30, 30),
    flags=cv2.CASCADE_SCALE_IMAGE)

# 遍历检测到的所有面部
for (fX, fY, fW, fH) in faceRects:
    # 提取面部ROI
    faceROI = gray[fY:fY + fH, fX:fX + fW]

    # 在面部ROI应用左右眼级联检测器
    eyeRects = detectors["eyes"].detectMultiScale(
        faceROI, scaleFactor=1.1, minNeighbors=10,
        minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)

    # 在面部ROI应用嘴部检测
    smileRects = detectors["smile"].detectMultiScale(
        faceROI, scaleFactor=1.1, minNeighbors=10,
        minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)

    # 遍历眼睛边界框
    for (eX, eY, eW, eH) in eyeRects:
        # 绘制眼睛边界框(红色)
        ptA = (fX + eX, fY + eY)
        ptB = (fX + eX + eW, fY + eY + eH)
        cv2.rectangle(image, ptA, ptB, (0, 0, 255), 2)

    # 遍历嘴部边界框
    for (sX, sY, sW, sH) in smileRects:
        # 绘制嘴边界框(蓝色)
        ptA = (fX + sX, fY + sY)
        ptB = (fX + sX + sW, fY + sY + sH)
        cv2.rectangle(image, ptA, ptB, (255, 0, 0), 2)

    # 绘制面部边界框(绿色)
    cv2.rectangle(image, (fX, fY), (fX + fW, fY + fH),
                  (0, 255, 0), 2)

# 展示输出帧
cv2.imshow("image", image)
cv2.waitKey(0)
# 清理工作
cv2.destroyAllWindows()

3.2 实时视频流检测

# USAGE
# python opencv_haar_cascades.py --cascades cascades

# 导入必要的包
import argparse
import os  # 不同系统路径分隔符
import time  # sleep 2秒

import cv2  # opencv绑定
import imutils
from imutils.video import VideoStream  # 访问网络摄像头

# 构建命令行参数及解析
# --cascades 级联检测器的路径
ap = argparse.ArgumentParser()
ap.add_argument("-c", "--cascades", type=str, default="cascades",
                help="path to input directory containing haar cascades")
args = vars(ap.parse_args())

# 初始化字典,并保存Haar级联检测器名称及文件路径
detectorPaths = {
    "face": "haarcascade_frontalface_default.xml",
    "eyes": "haarcascade_eye.xml",
    "smile": "haarcascade_smile.xml",
}

# 初始化字典以保存多个Haar级联检测器
print("[INFO] loading haar cascades...")
detectors = {}

# 遍历检测器路径
for (name, path) in detectorPaths.items():
    # 加载Haar级联检测器并保存到map
    path = os.path.sep.join([args["cascades"], path])
    detectors[name] = cv2.CascadeClassifier(path)

# 初始化视频流,允许摄像头预热2s
print("[INFO] starting video stream...")
vs = VideoStream(src=0).start()
time.sleep(2.0)

# 遍历视频流的每一帧
while True:
    # 获取视频流的每一帧,缩放,并转换灰度图
    frame = vs.read()
    frame = imutils.resize(frame, width=500)
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 使用合适的Haar检测器执行面部检测
    faceRects = detectors["face"].detectMultiScale(
        gray, scaleFactor=1.05, minNeighbors=5, minSize=(30, 30),
        flags=cv2.CASCADE_SCALE_IMAGE)

    # 遍历检测到的所有面部
    for (fX, fY, fW, fH) in faceRects:
        # 提取面部ROI
        faceROI = gray[fY:fY + fH, fX:fX + fW]

        # 在面部ROI应用左右眼级联检测器
        eyeRects = detectors["eyes"].detectMultiScale(
            faceROI, scaleFactor=1.1, minNeighbors=10,
            minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)

        # 在面部ROI应用嘴部检测
        smileRects = detectors["smile"].detectMultiScale(
            faceROI, scaleFactor=1.1, minNeighbors=10,
            minSize=(15, 15), flags=cv2.CASCADE_SCALE_IMAGE)

        # 遍历眼睛边界框
        for (eX, eY, eW, eH) in eyeRects:
            # 绘制眼睛边界框(红色)
            ptA = (fX + eX, fY + eY)
            ptB = (fX + eX + eW, fY + eY + eH)
            cv2.rectangle(frame, ptA, ptB, (0, 0, 255), 2)

        # 遍历嘴部边界框
        for (sX, sY, sW, sH) in smileRects:
            # 绘制嘴边界框(蓝色)
            ptA = (fX + sX, fY + sY)
            ptB = (fX + sX + sW, fY + sY + sH)
            cv2.rectangle(frame, ptA, ptB, (255, 0, 0), 2)

        # 绘制面部边界框(绿色)
        cv2.rectangle(frame, (fX, fY), (fX + fW, fY + fH),
                      (0, 255, 0), 2)

    # 展示输出帧
    cv2.imshow("Frame", frame)
    key = cv2.waitKey(1) & 0xFF
    # 按下‘q'键,退出循环
    if key == ord("q"):
        break

# 清理工作
cv2.destroyAllWindows()
vs.stop()

参考

https://www.pyimagesearch.com/2021/04/12/opencv-haar-cascades/

到此这篇关于超详细注释之OpenCV Haar级联检测器进行面部检测的文章就介绍到这了,更多相关OpenCV Haar内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • opencv基于Haar人脸检测和眼睛检测

    在这里,我们将进行人脸检测.最初,该算法需要大量正图像(面部图像)和负图像(无面部图像)来训练分类器.然后,我们需要从中提取特征.为此,使用下图所示的Haar功能.它们就像我们的卷积核.每个特征都是通过从黑色矩形下的像素总和中减去白色矩形下的像素总和而获得的单个值. 现在,每个内核的所有可能大小和位置都用于计算许多功能.(试想一下它需要多少计算?即使是一个24x24的窗口也会产生超过160000个特征).对于每个特征计算,我们需要找到白色和黑色矩形下的像素总和.为了解决这个问题,他们引入了整体形

  • 超详细注释之OpenCV Haar级联检测器进行面部检测

    目录 1. 效果图 2. 原理 2.1 Haar级联是什么? 2.2 Haar级联的问题与局限性 2.3 Haar级联预训练的模型 3. 源码 3.1 图像检测 3.2 实时视频流检测 参考 这篇博客将介绍如何使用预训练好的OpenCV Haar级联人脸.眼睛.嘴部检测器,并将它们应用于图片及实时视频流的检测. 人脸检测结果是最稳定和准确的.不幸的是,在许多情况下,眼睛检测和嘴巴检测结果是不可用的--对于面部特征/部分提取,强烈建议使用python,dlib,OpenCV提取眼睛,鼻子,嘴唇及下

  • 超详细注释之OpenCV实现视频实时人脸模糊和人脸马赛克

    目录 1. 效果图 2. 原理 2.1 什么是人脸模糊,如何将其用于人脸匿名化? 2.2 执行人脸模糊/匿名化的步骤 3. 源码 3.1 图像人脸模糊源码 3.2 实时视频流人脸模糊源码 参考 这篇博客将介绍人脸检测,然后使用Python,OpenCV模糊它们来"匿名化"每张图像,以确保隐私得到保护,保证没有人脸可以被识别如何使用. 并介绍俩种模糊的方法:简单高斯模糊.像素模糊. 人脸模糊和匿名化的实际应用包括: 公共/私人区域的隐私和身份保护 在线保护儿童(即在上传的照片中模糊未成年

  • 超详细注释之OpenCV dlib实现人脸采集

    上一篇博客中,我们了解了什么是面部标志,以及如何使用dlib,OpenCV和Python检测它们.利用dlib的HOG SVM的形状预测器获得面部ROI中面部区域的68个点(x,y)坐标. 这一篇博客中,将演示如何使用NumPy数组切片魔术来分别访问每个面部部分并提取眼睛,眉毛,鼻子,嘴巴和下巴的特征. 1. 效果图 先上一张检测完的图: 也可以每一部分先标识出来: 2. 原理 面部标志主要是: 口 右眉 左眉 右眼 左眼 鼻子 下颚线 这一节即提取这些部分: 从图中可以看到假设是以0为下标的数

  • 超详细注释之OpenCV更改像素与修改图像通道

    这篇博客将介绍使用Python,OpenCV获取.更改像素,修改图像通道,截取图像感兴趣ROI:单通道图,BGR三通道图,四通道透明图,不透明图: 1. 效果图 原图 VS 更改右下某个像素为红色,更改左上角1/4区域为绿色,效果图如下: 裁剪感兴趣区域:分别截取左上角.右上角.左下角.右下角,各占1/4:效果图如下: 原图 VS 图像单通道灰度图效果如下: 左上原图 VS 右上R通道图 VS 左下G通道图 VS 右下B通道图效果如下: 图像4通道 全透明图 VS 不透明效果图: 2. 源码 #

  • 超详细注释之OpenCV构建透明的叠加层

    为了构造透明的叠加层,需要准备两个图像: (1)原始图片: (2)要 "叠加"在第一个图像上的图像(包含某种级别的Alpha透明度). 透明叠加层的用例几乎无穷无尽,其中俩个是: 可以将运行时的重要信息直接覆盖在输出图像上,而不是在单独的窗口或终端中显示.使用透明的叠加层可以减少混淆输出图像内容的需要! 使用Alpha透明度,将两个图像"融合"在一起. 使用cv2.addWeighted应用透明叠加层功能 cv2.addWeighted(overlay, alpha

  • 超详细注释之OpenCV按位AND OR XOR和NOT

    这篇博客将介绍如何使用OpenCV应用按位AND.OR.XOR和NOT.上一篇学习了如何从图像中裁剪和提取感兴趣的区域(ROI),截取的都是矩形.但是如果想裁剪一个非矩形区域呢?该怎么办? 答案是同时应用位运算和掩蔽. AND:当且仅当两个像素都大于零时,按位AND为真. OR:如果两个像素中的任何一个大于零,则按位或为真. XOR:当且仅当两个像素中的一个大于零,而不是两个都大于零时,按位异或为真. NOT:按位NOT反转图像中的"开"和"关"像素. 比较好记的是

  • 超详细注释之OpenCV制作图像Mask

    这篇博客将介绍如何使用OpenCV制作Mask图像掩码.使用位运算和图像掩码允许我们只关注图像中感兴趣的部分,截取出任意区域的ROIs. 应用: 图像感兴趣区域的截取: 图像融合:构建透明的叠加层: 1. 效果图 原始图如下:(老九门颖宝&佛爷~) 矩形掩码 VS 效果图如下:(使用矩形掩码,只提取图像中包含人物的区域,而忽略其他区域) 圆形掩码 VS 效果图如下:(圆形掩模显示在左边,掩模的应用在右边.实质上可以使用任意形状的掩码图像,如矩形.圆.线.多边形等从图像中提取区域) 2. 源码 #

  • 超详细注释之OpenCV旋转图像任意角度

    上一篇博客介绍了 如何使用Python,OpenCV上下左右(或任意组合)平移图像.这篇博客将介绍如何使用OpenCV旋转图像任意角度.并演示如何使用imutils库中的两个函数imutils.rotate和imutils.rotate_bound不丢失细节的旋转图像. 使用OpenCV应用图像旋转时,有3种方法实现: cv2.getRotationMatrix2D 和 cv2.warpAffine: imutils.rotate 同方法1(可能局部丢失): imutils.rotate_bou

  • 超详细注释之OpenCV操作图像平移转换

    这篇博客将介绍如何使用Python,OpenCV对图像进行平移转换.平移是图像沿x轴和y轴的移动.使用平移,可以将图像上下左右移动,以及上述任意组合.要使用OpenCV平移图像,只需3步: 从磁盘加载图像 定义仿射变换矩阵 应用cv2.warpAffine仿射函数来执行平移 1. 效果图 用了颖宝明兰的新娘图片来演示效果~,喜欢这张图的原因,是这里有一首经典的催妆诗, <催妆诗> 金车欲上怯东风,排云见月醉酒空. 独自仙姿羞半吐,冰瓷露白借微红. 原图如下: 向右向下平移图 VS 向上向左平移

  • Java基础之颜色工具类(超详细注释)

    颜色工具类(超详细注释) 设置属性值自动格式化rgb值和十六进制颜色值. import java.util.HashMap; import java.util.Map; public class Color{ private final String[] hex_letters = {"0", "1", "2", "3", "4", "5", "6", "7

随机推荐