C++函数pyrUp和pyrDown来实现图像金字塔功能

目标

本文档尝试解答如下问题:

如何使用OpenCV函数 pyrUp 和 pyrDown 对图像进行向上和向下采样。

原理

Note 以下内容来自于Bradski和Kaehler的大作: Learning OpenCV 。

当我们需要将图像转换到另一个尺寸的时候, 有两种可能:

放大 图像 或者

缩小 图像。

尽管OpenCV 几何变换 部分提供了一个真正意义上的图像缩放函数(resize, 在以后的教程中会学到),不过在本篇我们首先学习一下使用 图像金字塔 来做图像缩放, 图像金字塔是视觉运用中广泛采用的一项技术。

图像金字塔

一个图像金字塔是一系列图像的集合 - 所有图像来源于同一张原始图像 - 通过梯次向下采样获得,直到达到某个终止条件才停止采样。

有两种类型的图像金字塔常常出现在文献和应用中:

高斯金字塔(Gaussian pyramid): 用来向下采样

拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像

在这篇文档中我们将使用 高斯金字塔 。

高斯金字塔

想想金字塔为一层一层的图像,层级越高,图像越小。

每一层都按从下到上的次序编号, 层级 (i+1) (表示为 G_{i+1} 尺寸小于层级 i (G_{i}))。

为了获取层级为 (i+1) 的金字塔图像,我们采用如下方法:

将 G_{i} 与高斯内核卷积:

将所有偶数行和列去除。

显而易见,结果图像只有原图的四分之一。通过对输入图像 G_{0} (原始图像) 不停迭代以上步骤就会得到整个金字塔。

以上过程描述了对图像的向下采样,如果将图像变大呢?:

首先,将图像在每个方向扩大为原来的两倍,新增的行和列以0填充(0)

使用先前同样的内核(乘以4)与放大后的图像卷积,获得 “新增像素” 的近似值。

这两个步骤(向下和向上采样) 分别通过OpenCV函数 pyrUp 和 pyrDown 实现, 我们将会在下面的示例中演示如何使用这两个函数。

Note 我们向下采样缩小图像的时候, 我们实际上 丢失 了一些信息。

源码

本教程的源码如下,你也可以从 这里 下载

#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <math.h>
#include <stdlib.h>
#include <stdio.h>
using namespace cv;
/// 全局变量
Mat src, dst, tmp;
char* window_name = "Pyramids Demo";
/**
 * @函数 main
 */
int main( int argc, char** argv )
{
 /// 指示说明
 printf( "\n Zoom In-Out demo \n " );
 printf( "------------------ \n" );
 printf( " * [u] -> Zoom in \n" );
 printf( " * [d] -> Zoom out \n" );
 printf( " * [ESC] -> Close program \n \n" );
 /// 测试图像 - 尺寸必须能被 2^{n} 整除
 src = imread( "../images/chicky_512.jpg" );
 if( !src.data )
 { printf(" No data! -- Exiting the program \n");
  return -1; }
 tmp = src;
 dst = tmp;
 /// 创建显示窗口
 namedWindow( window_name, CV_WINDOW_AUTOSIZE );
 imshow( window_name, dst );
 /// 循环
 while( true )
 {
 int c;
 c = waitKey(10);
 if( (char)c == 27 )
  { break; }
 if( (char)c == 'u' )
  { pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 ) );
  printf( "** Zoom In: Image x 2 \n" );
  }
 else if( (char)c == 'd' )
  { pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 ) );
  printf( "** Zoom Out: Image / 2 \n" );
  }
 imshow( window_name, dst );
 tmp = dst;
 }
 return 0;
}

解释

让我们来回顾一下本程序的总体流程:

装载图像(此处路径由程序设定,用户无需将图像路径当作参数输入)

/// 测试图像 - 尺寸必须能被 2^{n} 整除
src = imread( "../images/chicky_512.jpg" );
if( !src.data )
 { printf(" No data! -- Exiting the program \n");
 return -1; }

创建两个Mat实例, 一个用来储存操作结果(dst), 另一个用来存储零时结果(tmp)。

Mat src, dst, tmp;
/* ... */
tmp = src;
dst = tmp;

创建窗口显示结果

namedWindow( window_name, CV_WINDOW_AUTOSIZE );
imshow( window_name, dst );

执行无限循环,等待用户输入。

while( true )
{
 int c;
 c = waitKey(10);
 if( (char)c == 27 )
 { break; }
 if( (char)c == 'u' )
 { pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 ) );
  printf( "** Zoom In: Image x 2 \n" );
 }
 else if( (char)c == 'd' )
 { pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 ) );
  printf( "** Zoom Out: Image / 2 \n" );
 }
 imshow( window_name, dst );
 tmp = dst;
}

如果用户按 ESC 键程序退出。 此外,它还提供两个选项:

向上采样 (按 ‘u')

pyrUp( tmp, dst, Size( tmp.cols*2, tmp.rows*2 )

函数 pyrUp 接受了3个参数:

tmp: 当前图像, 初始化为原图像 src 。

dst: 目的图像( 显示图像,为输入图像的两倍)

Size( tmp.cols*2, tmp.rows*2 ) : 目的图像大小, 既然我们是向上采样, pyrUp 期待一个两倍于输入图像( tmp )的大小。

向下采样(按 ‘d')

pyrDown( tmp, dst, Size( tmp.cols/2, tmp.rows/2 )

类似于 pyrUp, 函数 pyrDown 也接受了3个参数:

tmp: 当前图像, 初始化为原图像 src 。

dst: 目的图像( 显示图像,为输入图像的一半)

Size( tmp.cols/2, tmp.rows/2 ) :目的图像大小, 既然我们是向下采样, pyrDown 期待一个一半于输入图像( tmp)的大小。

注意输入图像的大小(在两个方向)必须是2的冥,否则,将会显示错误。

最后,将输入图像 tmp 更新为当前显示图像, 这样后续操作将作用于更新后的图像。

tmp = dst;

结果

在编译上面的代码之后, 我们可以运行结果。 程序调用了图像 chicky_512.jpg ,你可以在 tutorial_code/image 文件夹找到它。 注意图像大小是 512 \times 512, 因此向下采样不会产生错误(512 = 2^{9})。 原图像如下所示:

首先按两次 ‘d' 连续两次向下采样 pyrDown ,结果如图:

由于我们缩小了图像,我们也因此丢失了一些信息。通过连续按两次 ‘u' 向上采样两次 pyrUp ,很明显图像有些失真:

以上所述是小编给大家介绍的C++函数pyrUp和pyrDown来实现图像金字塔功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

(0)

相关推荐

  • 基于C++实现kinect+opencv 获取深度及彩色数据

    开发环境 vs2010+OPENCV2.4.10 首先,下载最新的Kinect 2 SDK  http://www.microsoft.com/en-us/kinectforwindows/develop/downloads-docs.aspx 下载之后不要插入Kinect,最好也不用插入除了键盘鼠标以外的其它USB设备,然后安装SDK,安装完成之后插入Kinect,会有安装新设备的提示.安装完成之后可以去"开始"那里找到两个新安装的软件,一个是可以显示Kinect深度图,另外一个软件

  • OpenCV 2.4.3 C++ 平滑处理分析

    原理 平滑也称模糊, 是一项简单且使用频率很高的图像处理方法. 平滑处理时需要用到一个滤波器. 最常用的滤波器是线性滤波器,线性滤波处理的输出像素值(例如:)是输入像素值(例如:)的加权平均: 称为核, 它仅仅是一个加权系数. 均值平滑 下面是一个使用blur函数的均值平滑: 复制代码 代码如下: #include "opencv2/core/core.hpp" #include "opencv2/highgui/highgui.hpp" #include &quo

  • OpenCV中C++函数imread读取图片的问题及解决方法

    今天在用OpenCV实验Image Pyramid的时候发现一个奇怪的问题,就是利用C++函数imread读取图片的时候返回的结果总是空,而利用C函数cvLoadImage时却能读取到图像.代码如下: //环境:VS2010 + OpenCV 2.3.1 #include "stdafx.h" #include <cv.h> #include <highgui.h> #include <math.h> #include <stdlib.h>

  • C++函数pyrUp和pyrDown来实现图像金字塔功能

    目标 本文档尝试解答如下问题: 如何使用OpenCV函数 pyrUp 和 pyrDown 对图像进行向上和向下采样. 原理 Note 以下内容来自于Bradski和Kaehler的大作: Learning OpenCV . 当我们需要将图像转换到另一个尺寸的时候, 有两种可能: 放大 图像 或者 缩小 图像. 尽管OpenCV 几何变换 部分提供了一个真正意义上的图像缩放函数(resize, 在以后的教程中会学到),不过在本篇我们首先学习一下使用 图像金字塔 来做图像缩放, 图像金字塔是视觉运用

  • jsvascript图像处理—(计算机视觉应用)图像金字塔

    前言 上一篇文章,我们讲解了边缘梯度计算函数,这篇文章我们来了解图像金字塔. 图像金字塔? 图像金字塔被广泛用于计算机视觉应用中. 图像金字塔是一个图像集合,集合中所有的图像都源于同一个原始图像,而且是通过对原始图像连续降采样获得的. 常见的图像金字塔有下面两种: •高斯金字塔(Gaussian pyramid): 用来向下采样 •拉普拉斯金字塔(Laplacian pyramid): 用来从金字塔低层图像重建上层未采样图像 高斯金字塔 类似金字塔一样,高斯金字塔从底层原始图逐渐向下采样,越来越

  • python 用opencv实现图像修复和图像金字塔

    我们将学习如何通过一种称为修复的方法去除旧照片中的小噪音,笔画等.基本思路很简单:用相邻像素替换那些坏标记,使其看起来像邻域. cv2.inpaint() cv2.INPAINT_TELEA cv2.INPAINT_NS import numpy as np import cv2 as cv img = cv.imread('messi_2.jpg') mask = cv.imread('mask2.png',0) dst = cv.inpaint(img,mask,3,cv.INPAINT_T

  • OpenCV图像分割之分水岭算法与图像金字塔算法详解

    目录 前言 一.使用分水岭算法分割图像 1.cv2.distanceTransform()函数 2.cv2.connectedComponents()函数 3.cv2.watershed()函数 二.图像金字塔 1.高斯金字塔向下采样 2.高斯金字塔向上采样 3.拉普拉斯金字塔 4.应用图像金字塔实现图像的分割和融合 前言 主要介绍OpenCV中的分水岭算法.图像金字塔对图像进行分割的方法. 一.使用分水岭算法分割图像 分水岭算法的基本原理为:将任意的灰度图像视为地形图表面,其中灰度值高的部分表

  • Python图像处理之图像金字塔详解

    目录 一.图像金字塔原理 二.图像向上取样 三.图像向下取样 四.总结 一.图像金字塔原理 上一篇文章讲解的图像采样处理可以降低图像的大小,本文将补充图像金字塔知识,了解专门用于图像向上采样和向下采样的pyrUp()和pyrDown()函数. 图像金字塔是指由一组图像且不同分别率的子图集合,它是图像多尺度表达的一种,以多分辨率来解释图像的结构,主要用于图像的分割或压缩.一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合.如图10-1所示,它包括了四层图像,将

  • Android基于OpenCV实现图像金字塔

    目录 图像金字塔 高斯金字塔 拉普拉斯金字塔 API 下采样 上采样 操作 操作 效果 源码 图像金字塔 图像金字塔是图像中多尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构. 图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合.其通过梯次向下采样获得,直到达到某个终止条件才停止采样. 金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似. 我们将一层一层的图像比喻成金字塔

  • python OpenCV图像金字塔

    目录 1.图像金字塔理论基础 2.向下取样函数及使用 3.向上取样函数及使用 4.采样可逆性研究 5.拉普拉斯金字塔 6.图像轮廓介绍 轮廓近似 1.图像金字塔理论基础 图像金字塔是图像多尺度表达的一种,是一种以多分辨率来解释图像的有效但概念简单的结构.一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合.其通过梯次向下采样获得,直到达到某个终止条件才停止采样.我们将一层一层的图像比喻成金字塔,层级越高,则图像越小,分辨率越低.那我们为什么要做图像金字塔呢?这

  • OpenCV 图像金字塔的实现示例

    目录 1.高斯金字塔 2.拉普拉斯金字塔 本文主要介绍了OpenCV 图像金字塔,具有一定的参考价值,感兴趣的可以了解一下 高斯金字塔reduce void cv::pyrDown() expand void cv::pyrUp() 1.高斯金字塔 图像金字塔是对一张输入图像先模糊再下采样为原来的高.宽的1/2,不断重复模糊与下采样的过程就得到了不同分辨率的输出图像,叠加在一起就形成了图像金字塔. 高斯金字塔便是先进行高斯模糊,再进行reduce和expand操作.高斯金字塔中的较高级别(低分辨

  • OpenCV半小时掌握基本操作之图像金字塔

    目录 概述 图像金字塔 高斯金字塔 拉布拉斯金字塔 [OpenCV]⚠️高手勿入! 半小时学会基本操作 ⚠️ 图像金字塔 概述 OpenCV 是一个跨平台的计算机视觉库, 支持多语言, 功能强大. 今天小白就带大家一起携手走进 OpenCV 的世界. 图像金字塔 高斯金字塔 高斯金字塔 (Gaussian Pyramid) 是最基本的图像塔. 对图像进行高斯滤波, 然后去除偶数行和列. 对图像放大形成上采样. 下采样: 例子: # 读取图片 img = cv2.imread("person.jp

  • python计算机视觉opencv图像金字塔轮廓及模板匹配

    目录 1.图像金字塔 ①高斯金字塔 ②拉普拉斯金字塔 2.图像轮廓 ①寻找轮廓 ②轮廓特征 ③轮廓绘制 3.模板匹配 ①模板匹配 ②匹配框线绘制 ③多对象匹配 4.直方图统计 ①直方图绘制 ②直方图统计 ③直方图的mask操作 ④直方图均衡化 5.傅里叶变换 1.图像金字塔 ①高斯金字塔 向下采样,数据会越来越少,减少的方式是:将偶数行和列删除 向上采样,数据会越来越多,将图像在每个方向上扩大为原来的两倍,新增的行和列用0来填充.使用先前同样的内核与放大后的图像卷积,获得近似值. 上采样之后,图

随机推荐