C#实现基于ffmpeg加虹软的人脸识别的示例

2025-10-26 07:00:39

关于人脸识别

目前的人脸识别已经相对成熟，有各种收费免费的商业方案和开源方案，其中OpenCV很早就支持了人脸识别，在我选择人脸识别开发库时，也横向对比了三种库，包括在线识别的百度、开源的OpenCV和商业库虹软（中小型规模免费）。

百度的人脸识别，才上线不久，文档不太完善，之前联系百度，官方也给了我基于Android的Example，但是不太符合我的需求，一是照片需要上传至百度服务器（这个是最大的问题），其次，人脸的定位需要自行去实现（捕获到人脸后上传进行识别）。

OpenCV很早以前就用过，当时做人脸+车牌识别时，最先考虑的就是OpenCV，但是识别率在当时不算很高，后来是采用了一个电子科大的老师自行开发的识别库（相对易用，识别率也还不错），所以这次准备做时，没有选择OpenCV。

虹软其实在无意间发现的，当时正在寻找开发库，正在测试Python的一个方案，就发现有新闻说虹软的识别库全面开放并且可以免费使用，而且是离线识别，所以就下载尝试了一下，发现识别率还不错，所以就暂定了采用虹软的识别方案。这里主要就给大家分享一下开发过程当中的一些坑和使用心得，顺便开源识别库的C# Wrapper。

SDK的C# Wrapper

由于虹软的库是采用C++开发的，而我的应用程序采用的是C#，所以，需要对库进行包装，便于C#的调用，包装的主要需求是可以在C#中快速方便的调用，无需考虑内存、指针等问题，并且具备一定的容错性。Wrapper库目前已经开源，大家可以到Github上进行下载，地址点击这里。Wrapper库基本上没有什么可以说的，无非是对PInvoke的包装，只是里面做了比较多的细节处理，屏蔽了调用细节，提供了相对高层的函数。有兴趣的可以看看源代码。

Wrapper库的使用例子

基本使用

人脸检测（静态图片）：

using (var detection = LocatorFactory.GetDetectionLocator("appId", "sdkKey"))
{
  var image = Image.FromFile("test.jpg");
  var bitmap = new Bitmap(image);

  var result = detection.Detect(bitmap, out var locateResult);
  //检测到位置信息在使用完毕后，需要释放资源，避免内存泄露
  using (locateResult)
  {
    if (result == ErrorCode.Ok && locateResult.FaceCount > 0)
    {
      using (var g = Graphics.FromImage(bitmap))
      {
        var face = locateResult.Faces[0].ToRectangle();
        g.DrawRectangle(new Pen(Color.Chartreuse), face.X, face.Y, face.Width, face.Height);
      }

      bitmap.Save("output.jpg", ImageFormat.Jpeg);
    }
  }
}

人脸跟踪（人脸跟踪一般用于视频的连续帧识别，相较于检测，又更高的执行效率，这里用静态图片做例子，实际使用和检测没啥区别）：

using (var detection = LocatorFactory.GetTrackingLocator("appId", "sdkKey"))
{
  var image = Image.FromFile("test.jpg");
  var bitmap = new Bitmap(image);

  var result = detection.Detect(bitmap, out var locateResult);
  using (locateResult)
  {
    if (result == ErrorCode.Ok && locateResult.FaceCount > 0)
    {
      using (var g = Graphics.FromImage(bitmap))
      {
        var face = locateResult.Faces[0].ToRectangle();
        g.DrawRectangle(new Pen(Color.Chartreuse), face.X, face.Y, face.Width, face.Height);
      }

      bitmap.Save("output.jpg", ImageFormat.Jpeg);
    }
  }
}

人脸对比：

using (var proccesor = new FaceProcessor("appid",
        "locatorKey", "recognizeKey", true))
{
  var image1 = Image.FromFile("test2.jpg");
  var image2 = Image.FromFile("test.jpg");

  var result1 = proccesor.LocateExtract(new Bitmap(image1));
  var result2 = proccesor.LocateExtract(new Bitmap(image2));

  //FaceProcessor是个整合包装类，集成了检测和识别，如果要单独使用识别，可以使用FaceRecognize类
  //这里做演示，假设图片都只有一张脸
  //可以将FeatureData持久化保存，这个即是人脸特征数据，用于后续的人脸匹配
  //File.WriteAllBytes("XXX.data", feature.FeatureData);FeatureData会自动转型为byte数组

  if ((result1 != null) & (result2 != null))
    Console.WriteLine(proccesor.Match(result1[0].FeatureData, result2[0].FeatureData, true));
}

使用注意事项

LocateResult（检测结果）和Feature（人脸特征）都包含需要释放的内存资源，在使用完毕后，记得需要释放，否则会引起内存泄露。FaceProcessor和FaceRecognize的Match函数，在完成比较后，可以自动释放，只需要最后两个参数指定为true即可，如果是用于人脸匹配（1:N），则可以采用默认参数，这种情况下，第一个参数指定的特征数据不会自动释放，用于循环和特征库的特征进行比对。

整合的完整例子

在Github上，有完整的FaceDemo例子，里面主要实现了通过ffmpeg采集RTSP协议的图像（使用海康的摄像机），然后进行人脸匹配。在开发过程中遇到不少的坑。

人脸识别的首要工作就是捕获摄像机视频帧，这一块上是坑的最久的，因为最开始采用的是OpenCV的包装库，Emgu.CV，在开发过程中，捕获USB摄像头时，倒是问题不大，没有出现过异常。在捕获RTSP视频流时，会不定时的出现AccessviolationException异常，短则几十分钟，长则几个小时，总之就是不稳定。在官方Github地址上，也提了Issue，他们给出的答复是屏蔽的我业务逻辑，仅捕获视频流试试，结果问题依然，所以，我基本坑定了试Emgu.CV上面的问题。后来经过反复的实验，最终确定了选择ffmpeg。

ffmepg主要采用ProcessStartInfo进行调用，我采用的是NReco.VideoConverter（一个ffmpeg调用的包装，可以通过nuget搜索安装），虽然ffmpeg解决了稳定性问题，但是实际开发时，也遇到了不少坑，其中，最主要的是NReco.VideoConverter没有任何文档和例子（实际有，需要75刀购买），所以，自己研究了半天，如何捕获视频流并转换为Bitmap对象。只要实现这一步，后续就是调用Wrapper就行了。

FaceDemo详解

上面说到了，通过ffmpeg捕获视频流并转换Bitmap是重点，所以，这里也主要介绍这一块。

首先是ffmpeg的调用参数：

var setting =
new ConvertSettings
{
  CustomOutputArgs = "-an -r 15 -pix_fmt bgr24 -updatefirst 1"
}; //-s 1920x1080 -q:v 2 -b:v 64k

task = ffmpeg.ConvertLiveMedia("rtsp://admin:12qwaszxA@192.168.1.64:554/h264/ch1/main/av_stream", null,
outputStream, Format.raw_video, setting);
task.OutputDataReceived += DataReceived;
task.Start();

-an表示不捕获音频流，-r表示帧率，根据需求和实际设备调整此参数，-pix_fmt比较重要，一般情况下，指定为bgr24不会有太大问题（还是看具体设备），之前就是用成了rgb24，结果捕获出来的图像，人都变成阿凡达了，颜色是反的。最后一个参数，坑的我差点放弃这个方案。本身，ffmpeg在调用时，需要指定一个文件名模板，捕获到的输出会按照模板生成文件，如果要将数据输出到控制台，则最后传入一个-即可，最开始没有指定updatefirst，ffmpeg在捕获了第一帧后就抛出了异常，最后查了半天ffmpeg说明（完整参数说明非常多，输出到文本有1319KB），发现了这个参数，表示持续更新第一个文件。最后，在调用视频捕获是，需要指定输出格式，必须指定为Format.raw_video，实际上这个格式名称有些误导人，按道理将应该叫做raw_image，因为最终输出的是每帧原始的位图数据。

到此为止，还并没有解决视频流数据的捕获，因为又来一个坑，ProcessStartInfo的控制台缓冲区大小只有32768 bytes，即，每一次的输出，实际上并不是一个完整的位图数据。

//完整代码参加Github源代码
//代码片段1
private Bitmap _image;
private IntPtr _pImage;

{
  _pImage = Marshal.AllocHGlobal(1920 * 1080 * 3);
  _image = new Bitmap(1920, 1080, 1920 * 3, PixelFormat.Format24bppRgb, _pImage);
}

//代码片段2
private MemoryStream outputStream;

private void DataReceived(object sender, EventArgs e)
{
  if (outputStream.Position == 6220800)
    lock (_imageLock)
    {
      var data = outputStream.ToArray();

      Marshal.Copy(data, 0, _pImage, data.Length);

      outputStream.Seek(0, SeekOrigin.Begin);
    }
}

花了不少时间摸索（不要看只有几行，人都整崩溃了），得出了上述代码。首先，我捕获的图像数据是24位的，并且图像大小是1080p的，所以，实际上，一个原始位图数据的大小为stride * height，即width * 3 * height，大小为6220800 bytes。所以，在判断了捕获数据到达这个大小后，就进行Bitmap转换处理，然后将MemoryStream的位置移动到最开始。需要注意的时，由于捕获到的是原始数据（不包含bmp的HeaderInfo），所以注意看Bitmap的构造方式，是通过一个指向原始数据位置的指针就行构造的，更新该图像时，也仅需要更新指针指向的位置数据即可，无需在建立新的Bitmap实例。

位图数据获取到了，就可以进行识别处理了，高高兴兴的加上了识别逻辑，但是现实总是充满了意外和惊喜，没错，坑又来了。没有加入识别逻辑的时候，捕获到的图像在PictureBox上显示非常正常，清晰、流畅，加上识别逻辑后，开始出现花屏（捕获到的图像花屏）、拖影、显示延迟（至少会延迟10-20秒以上）、程序卡顿，总之就是各种问题。最开始，我的识别逻辑写到DataReceived方法里面的，这个方法是运行于主线程外的另一个线程中的，其实按道理将，捕获、识别、显示位于一个线程中，应该是不会出现问题，我估计（不确定，没有去深入研究，如果谁知道实际原因，可以留言告诉我），是因为ffmpeg的原因，因为ffmpeg是单独的一个进程在跑，他的数据捕获是持续在进行的，而识别模块的处理时间大于每一帧的采集时间，所以，缓冲区中的数据没有得到及时处理，ffmpeg接收到的部分图像数据（大于32768的数据）被丢弃了，然后就出现了各种问题。最后，又是一次耗时不短的探索之旅。

private void Render()
{
  while (_renderRunning)
  {
    if (_image == null)
      continue;

    Bitmap image;

    lock (_imageLock)
    {
      image = (Bitmap) _image.Clone();
    }

    if (_shouldShot){
      WriteFeature(image);
      _shouldShot = false;
    }

    Verify(image);

    if (videoImage.InvokeRequired)
      videoImage.Invoke(new Action(() => { videoImage.Image = image; }));
    else
      videoImage.Image = image;
  }
}

如上代码所述，我单独开了一个线程，用于图像的识别处理和显示，每次都从已捕获到的图像中克隆出新的Bitmap实例进行处理。这种方式的缺点在于，有可能会导致丢帧的现象，因为上面说到了，识别时间（如果检测到新的人脸，那么加上匹配，大约需要130ms左右）大于每帧时间，但是并不影响识别效果和需求的实现，基本丢弃的帧可以忽律。最后，运行，稳定了、完美了，实际也感觉不到丢帧。

Demo程序，我运行了大约4天左右，中间没有出现过任何异常和识别错误。

写在最后

虽然虹软官方表示，免费识别库适用于1000人脸库以下的识别，实际上，做一定的工作（工作量其实也不小），也是可以实现较大规模的人脸搜索滴。例如，采用多线程进行匹配，如果人脸库人脸数量大于1000，则可以考虑每个线程分别进行处理，人脸特征数据做缓存（一个人脸的特征数据是22KB，对内存要求较高），以提升程序的识别搜索效率。或者人脸库特别大的情况下，可以采用分布式处理，人脸特征加载到Redis数据库当中，多个进程多个线程读取处理，每个线程上传自己的识别结果，然后主进程做结果合并判断工作，主要的挑战就在于多线程的工作分配一致性和对单点故障的容错性。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

C#简单爬虫案例分享

本文实例为大家分享了C#简单爬虫案例,供大家参考,具体内容如下 using System; using System.Collections.Generic; using System.Linq; using System.Net; using System.Text; using System.Text.RegularExpressions; using System.Threading.Tasks; namespace ConsoleApplication1 { class Program
C#中Socket与Unity相结合示例代码

前言初步接触了Socket,现使其与Unity相结合,做成一个简单的客户端之间可以互相发送消息的一个Test.下面话不多说了,来一起看看详细的介绍吧. 方法如下: 首先,是服务端的代码. 创建一个连接池,用于存储客户端的数量. using System; using System.Net; using System.Net.Sockets; using System.Collections; using System.Collections.Generic; namespace Server
利用C#实现最基本的小说爬虫示例代码

前言作为一个新手,最近在学习C#,自己折腾弄了个简单的小说爬虫,实现了把小说内容爬下来写入txt,还只能爬指定网站. 第一次搞爬虫,涉及到了网络协议,正则表达式,弄得手忙脚乱跑起来效率还差劲,慢慢改吧.下面话不多说了,来一起看看详细的介绍吧. 爬的目标:http://www.166xs.com/xiaoshuo/83/83557/ 一.先写HttpWebRequest把网站扒下来这里有几个坑,大概说下: 第一个就是记得弄个代理IP爬网站,第一次忘了弄代理然后ip就被封了..... 第二个就是
C#中可枚举类型详解

枚举是迭代一个集合中的数据项的过程. 我们经常使用的大多数集合实际上都已经实现了枚举的接口IEnumerable和IEnumerator接口,这样才能使用foreach迭代,有些是含有某种抽象了枚举细节的接口:ArrayList类型有索引,BitArray有Get方法,哈希表和字典有键和值..........其实他们都已经实现了IEnumerable和IEnumerator接口.所以一切的集合和数组都可以用IEnumerable或者IEnumerable<T>接口来定义. IEnumerabl
C# 利用代理爬虫网页的实现方法

C# 利用代理爬虫网页实现代码: // yanggang@mimvp.com // http://proxy.mimvp.com // 2015-11-09 using System; using System.IO; using System.Net; using System.Text; namespace ConsoleApplication1 { class Program { public static void Main(string[] args) { System.Net.We
C# 使用Free Spire.Presentation 实现对PPT插入、编辑、删除表格

现代学习和办公当中,经常会接触到对表格的运用,像各种单据.报表.账户等等.在PPT演示文稿中同样不可避免的应用到各种数据表格.对于在PPT中插入表格,我发现了一个新方法,不过我用到了一款免费的.NET组件--Free Spire.Presentation,在C#中添加该产品DLL文件,可以简单快速地实现对演示文稿的表格插入.编辑和删除等操作.有需要的话可以在下面的网址下载:https://www.e-iceblue.cn/Downloads/Free-Spire-Presentation-NET
C#使用yield关键字构建迭代器详解

以前,如果我们希望构建支持foreach枚举的自定义集合,只能实现IEnumerable接口(可能还有IEnumerator()),返回值还必须是IEnumerator类型,除此之外还可以通过迭代器来使用构建foreach循环的类型,详细见下链接. 代码 public class Car { //内部状态数据 public int CurentSpeed; public int MaxSpeed; public string name; //汽车能不能用 private bool carIsde
C#实现基于ffmpeg加虹软的人脸识别的示例

关于人脸识别目前的人脸识别已经相对成熟,有各种收费免费的商业方案和开源方案,其中OpenCV很早就支持了人脸识别,在我选择人脸识别开发库时,也横向对比了三种库,包括在线识别的百度.开源的OpenCV和商业库虹软(中小型规模免费). 百度的人脸识别,才上线不久,文档不太完善,之前联系百度,官方也给了我基于Android的Example,但是不太符合我的需求,一是照片需要上传至百度服务器(这个是最大的问题),其次,人脸的定位需要自行去实现(捕获到人脸后上传进行识别). OpenCV很早以前就用过,
Java基于虹软实现人脸识别、人脸比对、活性检测等

目录虹软一.注册虹软开发者平台二.开始使用SDK 虹软免费,高级版本试用支持在线.离线有 Java SDK,C++ SDK 一.注册虹软开发者平台点击注册注册完成后可在“我的应用”中新建应用,获得 APP_ID 和 SDK_Key,请记住这两个信息,后续 SDK 中会用到. 接下来下载SDK就行了. 二.开始使用SDK SDK包结构在下载的sdk包中,包结构大概是这样 |—demo| |—ArcFaceDemo Demo工程|—doc| |—ARCSOFT_ARC_FACE_DE
详解基于Facecognition+Opencv快速搭建人脸识别及跟踪应用

人脸识别技术已经相当成熟,面对满大街的人脸识别应用,像单位门禁.刷脸打卡.App解锁.刷脸支付.口罩检测........ 作为一个图像处理的爱好者,怎能放过人脸识别这一环呢!调研开搞,发现了超实用的Facecognition!现在和大家分享下~~ Facecognition人脸识别原理大体可分为: 1.通过hog算子定位人脸,也可以用cnn模型,但本文没试过: 2.Dlib有专门的函数和模型,实现人脸68个特征点的定位.通过图像的几何变换(仿射.旋转.缩放),使各个特征点对齐(将眼睛.嘴等部位移
基于Python实现简单的人脸识别系统

目录前言基本原理代码实现创建虚拟环境安装必要的库前言最近又多了不少朋友关注,先在这里谢谢大家.关注我的朋友大多数都是大学生,而且我简单看了一下,低年级的大学生居多,大多数都是为了完成课程设计,作为一个过来人,还是希望大家平时能多抽出点时间学习一下,这种临时抱佛脚的策略要少用嗷.今天我们来python实现一个人脸识别系统,主要是借助了dlib这个库,相当于我们直接调用现成的库来进行人脸识别,就省去了之前教程中的数据收集和模型训练的步骤了. B站视频:用300行代码实现人脸识别系统_哔
Python基于OpenCV库Adaboost实现人脸识别功能详解

本文实例讲述了Python基于OpenCV库Adaboost实现人脸识别功能.分享给大家供大家参考,具体如下: 以前用Matlab写神经网络的面部眼镜识别算法,研究算法逻辑,采集大量训练数据,迭代,计算各感知器的系数...相当之麻烦~而现在运用调用pythonOpenCV库Adaboost算法,无需知道算法逻辑,无需进行模型训练,人脸识别变得相当之简单了. 需要用到的库是opencv(open source computer vision),下载安装方式如下: 使用pip install num
基于opencv和pillow实现人脸识别系统(附demo)

目录一.人脸检测和数据收集二.训练识别器三.人脸识别和显示本文不涉及分类器.训练识别器等算法原理,仅包含对其应用(未来我也会写自己对机器学习算法原理的一些观点和了解) 首先我们需要知道的是利用现有框架做一个人脸识别系统并不难,然后就开始我们的系统开发吧. 我们的系统主要分为三个部分,然后我还会提出对补获图片不能添加中文的解决方案.我们需要完成的任务:1.人脸检测和数据收集2.训练识别器3.人脸识别和显示在读此篇文章之前我相信你已经做了python环境部署和opencv模块的下载安装工作
使用卷积神经网络（CNN）做人脸识别的示例代码

上回书说到了对人脸的检测,这回就开始正式进入人脸识别的阶段. 关于人脸识别,目前有很多经典的算法,当我大学时代,我的老师给我推荐的第一个算法是特征脸法,原理是先将图像灰度化,然后将图像每行首尾相接拉成一个列向量,接下来为了降低运算量要用PCA降维, 最后进分类器分类,可以使用KNN.SVM.神经网络等等,甚至可以用最简单的欧氏距离来度量每个列向量之间的相似度.OpenCV中也提供了相应的EigenFaceRecognizer库来实现该算法,除此之外还有FisherFaceRecognizer.L
使用python-cv2实现Harr+Adaboost人脸识别的示例

Haar特征哈尔特征使用检测窗口中指定位置的相邻矩形,计算每一个矩形的像素和并取其差值.然后用这些差值来对图像的子区域进行分类. haar特征模板有以下几种: 以第一个haar特征模板为例计算方式 1.特征 = 白色 - 黑色(用白色区域的像素之和减去黑色区域的象征之和) 2.特征 = 整个区域 * 权重 + 黑色 * 权重使用haar模板处理图像从图像的起点开始,利用haar模板从左往右遍历,从上往下遍历,并设置步长,同时考虑图像大小和模板大小的信息假如我们现在有一个 1080 *
Python三十行代码实现简单人脸识别的示例代码

一.库介绍 opencv,face_recognition,numpy,以及dlib 注意: 安装opencv速度可能过慢,需要更换国内镜像源,参考:https://www.jb51.net/article/208359.htm 附带Python3.7,64位版本 dlib whl下载路径:dlib-19_jb51.rar 二.库安装 pip install opencv-python pip install face_recognition pip install numpy dlib库需进入
python+opencv实现的简单人脸识别代码示例

# 源码如下: #!/usr/bin/env python #coding=utf-8 import os from PIL import Image, ImageDraw import cv def detect_object(image): '''检测图片,获取人脸在图片中的坐标''' grayscale = cv.CreateImage((image.width, image.height), 8, 1) cv.CvtColor(image, grayscale, cv.CV_BGR2GR

C#实现基于ffmpeg加虹软的人脸识别的示例

相关推荐

随机推荐