AI与Python计算机视觉教程

目录
  • 计算机视觉
  • 计算机视觉层次结构
  • 计算机视觉与图像处理
    • 应用
    • 机器人
    • 医学
    • 安全
    • 运输
  • 安装有用的包
  • 阅读,写作和显示图像
  • OpenCV函数用于读取,显示,写入图像文件
    • 示例
    • 色彩空间转换
    • 边缘检测
    • 人脸检测
      • 哈尔Cascade数据
    • 眼睛检测

计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉。在本章中,您将详细了解这一点。

计算机视觉

计算机视觉是一门学科,根据场景中存在的结构的属性,研究如何从其2d图像重建,中断和理解3d场景。

计算机视觉层次结构

计算机视觉分为以下三个基本类别 -

  • 低级视觉 - 它包括用于特征提取的过程图像。
  • 中级视觉 - 包括物体识别和3D场景解释
  • 高级视觉 - 包括活动,意图和行为等场景的概念性描述。

计算机视觉与图像处理

图像处理研究图像到图像的变换。图像处理的输入和输出都是图像。

计算机视觉是从图像中构建对物理对象的明确,有意义的描述。计算机视觉的输出是对3D场景中的结构的描述或解释。

应用

计算机视觉在以下领域中得到应用 -

机器人

  • 本地化 - 自动确定机器人位置
  • 导航
  • 障碍避免
  • 装配(挂孔,焊接,喷漆)
  • 操纵(例如PUMA机器人操纵器)
  • 人机交互(HRI):与人交互和服务的智能机器人

医学

  • 分类和检测(例如病变或细胞分类和肿瘤检测)
  • 2D / 3D分割
  • 3D人体器官重建(MRI或超声)
  • 视觉引导机器人手术

安全

生物识别技术(虹膜,指纹,面部识别)

监视 - 检测某些可疑活动或行为

运输

自动驾驶汽车安全性,例如驾驶员警惕监控 工业自动化应用 工业检查(缺陷检测)部件条形码和包装标签阅读对象排序文件理解(例如OCR)

安装有用的包

对于使用Python的计算机视觉,您可以使用名为OpenCV(开源计算机视觉)的流行库。它是一个编程功能库,主要针对实时计算机视觉。它是用C ++编写的,其主要接口是用C ++编写的。您可以借助以下命令安装此软件包 -

pip install opencv_python-X.X-cp36-cp36m-winX.whl

这里X代表您机器上安装的Python版本以及您拥有的win32或64位。

如果您使用的是anaconda环境,请使用以下命令安装OpenCV -

conda install -c conda-forge opencv

阅读,写作和显示图像

大多数CV应用程序需要将图像作为输入并将图像作为输出生成。在本节中,您将学习如何借助OpenCV提供的功能读取和写入图像文件。

OpenCV函数用于读取,显示,写入图像文件

OpenCV为此提供以下功能 -

  • imread()函数 - 这是读取图像的函数。OpenCV imread()支持各种图像格式,如PNG,JPEG,JPG,TIFF等。
  • imshow()函数 - 这是在窗口中显示图像的功能。窗口自动适合图像大小。OpenCV imshow()支持各种图像格式,如PNG,JPEG,JPG,TIFF等。
  • imwrite()函数 - 这是写入图像的函数。OpenCV imwrite()支持各种图像格式,如PNG,JPEG,JPG,TIFF等。

示例

此示例显示了用于以一种格式读取图像的Python代码 - 在窗口中显示它并以其他格式写入相同的图像。考虑以下步骤 -

如图所示导入OpenCV包 -

import cv2

现在,要读取特定图像,请使用imread()函数 -

image = cv2.imread('image_flower.jpg')

要显示图像,请使用imshow()函数。您可以在其中查看图像的窗口名称为image_flower。

cv2.imshow('image_flower',image)cv2.destroyAllwindows()

现在,我们可以使用imwrite()函数将相同的图像写入另一种格式,例如.png -

cv2.imwrite('image_flower.png',image)

输出True表示图像已成功写入.png文件也位于同一文件夹中。

True

注意 - 函数destroyallWindows()只是破坏我们创建的所有窗口。

色彩空间转换

在OpenCV中,图像不是使用传统的RGB颜色存储的,而是以相反的顺序存储,即以BGR顺序存储。因此,读取图像时的默认颜色代码是BGR。所述cvtColor()中的图像从一个颜色代码转换为其他颜色转换功能。

考虑此示例将图像从BGR转换为灰度。

如图所示导入OpenCV包 -

import cv2

现在,要读取特定图像,请使用imread()函数 -

image = cv2.imread('image_flower.jpg')

现在,如果我们使用imshow()函数看到这个图像,那么我们可以看到这个图像在BGR中。

cv2.imshow('BGR_Penguins',image)

现在,使用cvtColor()函数将此图像转换为灰度。

image = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
cv2.imshow('gray_penguins',image)

边缘检测

人们在看到粗略的草图后,可以很容易地识别出许多物体类型和姿势。这就是边缘在人类生活以及计算机视觉应用中发挥重要作用的原因。OpenCV提供了一个非常简单有用的函数Canny()来检测边缘。

以下示例显示了边缘的清晰标识。

导入OpenCV包如图所示 -

import cv2import numpy as np

现在,要读取特定图像,请使用imread()函数。

image = cv2.imread('Penguins.jpg')

现在,使用Canny()函数检测已读取图像的边缘。

cv2.imwrite(‘edges_Penguins.jpg',cv2.Canny(image,200,300))

现在,要显示带边的图像,请使用imshow()函数。

cv2.imshow(‘edges', cv2.imread(‘‘edges_Penguins.jpg'))

这个Python程序将使用边缘检测创建一个名为edges_penguins.jpg的图像。

人脸检测

人脸检测是计算机视觉的迷人应用之一,使其更加真实和未来。OpenCV具有执行面部检测的内置工具。我们将使用Haar级联分类器进行人脸检测。

哈尔Cascade数据

我们需要数据来使用Haar级联分类器。您可以在我们的OpenCV包中找到这些数据。安装OpenCv后,您可以看到文件夹名称haarcascades。不同的应用程序会有.xml文件。现在,将它们全部复制以供不同使用,然后粘贴到当前项目下的新文件夹中。

以下是使用Haar Cascade检测Amitabh Bachan面部的Python代码,如下图所示 -

如图所示导入OpenCV包 -

import cv2
import numpy as np

现在,使用HaarCascadeClassifier检测面部 -

face_detection=
cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/
haarcascade_frontalface_default.xml')

现在,要读取特定图像,请使用imread()函数 -

img = cv2.imread('AB.jpg')

现在,将其转换为灰度,因为它会接受灰色图像 -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在,使用face_detection.detectMultiScale,执行实际的面部检测

faces = face_detection.detectMultiScale(gray, 1.3, 5)

现在,在整个脸部周围画一个矩形 -

for (x,y,w,h) in faces:
   img = cv2.rectangle(img,(x,y),(x+w, y+h),(255,0,0),3)
cv2.imwrite('Face_AB.jpg',img)

这个Python程序将使用面部检测创建一个名为Face_AB.jpg的图像,如图所示

眼睛检测

眼睛检测是计算机视觉的另一个迷人应用,它使其更加真实和未来。OpenCV有一个内置的工具来执行眼睛检测。我们将使用Haar级联分类器进行眼睛检测。

以下示例给出了使用Haar Cascade检测Amitabh Bachan面部的Python代码,如下图所示 -

导入OpenCV包如图所示 -

import cv2import numpy as np

现在,使用HaarCascadeClassifier检测面部 -

eye_cascade = cv2.CascadeClassifier('D:/ProgramData/cascadeclassifier/haarcascade_eye.xml')

现在,要读取特定图像,请使用imread()函数

img = cv2.imread('AB_Eye.jpg')

现在,将其转换为灰度,因为它会接受灰色图像 -

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

现在借助eye_cascade.detectMultiScale,执行实际的人脸检测

eyes = eye_cascade.detectMultiScale(gray, 1.03, 5)

现在,在整个脸部周围画一个矩形 -

for (ex,ey,ew,eh) in eyes:
   img = cv2.rectangle(img,(ex,ey),(ex+ew, ey+eh),(0,255,0),2)
cv2.imwrite('Eye_AB.jpg',img)

这个Python程序将创建一个名为Eye_AB.jpg的图像,其中带有眼睛检测,如图所示 -

以上就是AI与Python计算机视觉教程的详细内容,更多关于AI Python计算机视觉的资料请关注我们其它相关文章!

(0)

相关推荐

  • python计算机视觉实现全景图像拼接示例

    首先对图片进行预处理,是图片的分配率大小在合适的范围内,避免图片太大占满整个电脑屏幕. from PIL import Image def produceImage(file_in, width, height, file_out): image = Image.open(file_in) resized_image = image.resize((height, width), Image.ANTIALIAS) resized_image.save(file_out) if __name__

  • Python与AI分析时间序列数据

    目录 简介 序列分析或时间序列分析的基本概念 安装实用软件包 Pandas hmmlearn PyStruct CVXOPT Pandas:处理,切片和从时间序列数据中提取统计数据 示例 处理时间序列数据 切片时间序列数据 提取来自时间序列数据的统计数据 平均值 最大值 最小值 一次性获取所有内容 重新采样 使用mean()重新采样 Re -sampling with median() 滚动平均值 通过隐马尔可夫分析顺序数据模型(HMM) 隐马尔可夫模型(HMM) 状态(S) 输出符号(O) 状

  • AI与Python人工智能遗传算法

    目录 什么是遗传算法? 如何使用GA进行优化问题? GA机制优化过程的阶段 安装必要的软件包 使用遗传算法实现解决方案 生成位模式 符号回归问题 本章详细讨论了人工智能的遗传算法. 什么是遗传算法? 遗传算法(GA)是基于自然选择和遗传概念的基于搜索的算法.GA是更大的计算分支的子集,称为进化计算. GA由John Holland及其密歇根大学的学生和同事开发,最着名的是David E. Goldberg.从那以后,已经尝试了各种优化问题并取得了很大的成功. 在GA中,我们有一组可能的解决方案来

  • Python计算机视觉SIFT尺度不变的图像特征变换

    目录 图像特征-SIFT尺度不变特征变换 1.1图像尺度空间 1.2多分辨率金字塔 1.3高斯差分金字塔 1.4DoG空间极值检测 1.5关键点的精确定位 1.6消除边界响应 1.7特征点的主方向 1.8生成特征描述 OpenCV SIFT函数 图像特征-SIFT尺度不变特征变换 1.1图像尺度空间 在一定的范围内,无论物体是大还是小,人眼都可以分辨出来,然后计算机要具有相同的能力却很难,所以要让机器能够对物体在不同尺度下有一个统一的认知,就需要考虑图像在不同尺度下都存在的特点. 尺度空间的获取

  • AI与Python人工智能启发式搜索概念理解

    目录 AI中的启发式搜索的概念 不知情和知情搜索之间的区别 不知情的搜索 知情搜索 约束满足问题(CSP) 约束满足解决现实问题 解决代数关系 魔术广场 启发式搜索在人工智能中起着关键作用.在本章中,您将详细了解它. AI中的启发式搜索的概念 启发式是一个经验法则,它引导我们找到可能的解决方案.人工智能中的大多数问题具有指数性,并且具有许多可能的解决方案.您不确切知道哪些解决方案是正确的,并且检查所有解决方案将非常昂贵. 因此,启发式的使用缩小了对解决方案的搜索范围并消除了错误的选项.使用启发式

  • Python调用百度AI实现身份证识别

    目录 一.安装baidu-aip模块 二.获取百度AI接口密钥 三.调用百度接口识别身份证 一.安装baidu-aip模块 按win+R打开cmd,在里面输入 pip3 install baidu-aip 若出现如下界面,即成功安装了baidu-aip模块: 如果想快速了解识别营业执照代码原理,可以跳过第二部分,先看第三部分的内容. 二.获取百度AI接口密钥 在应用python识别身份证的过程中,有三行代码使用了百度AI接口密钥,故先阐述如何获得该密钥.首先,进入如下百度AI官方网站:https

  • AI与Python计算机视觉教程

    目录 计算机视觉 计算机视觉层次结构 计算机视觉与图像处理 应用 机器人 医学 安全 运输 安装有用的包 阅读,写作和显示图像 OpenCV函数用于读取,显示,写入图像文件 示例 色彩空间转换 边缘检测 人脸检测 哈尔Cascade数据 眼睛检测 计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉.在本章中,您将详细了解这一点. 计算机视觉 计算机视觉是一门学科,根据场景中存在的结构的属性,研究如何从其2d图像重建,中断和理解3d场景. 计算机视觉层次结构 计算机视觉分为以下三个基本类别 -

  • 人工智能(AI)首选Python的原因解析

    一.为何人工智能(AI)首选Python? 读完这篇文章你就知道了.我们看谷歌的TensorFlow基本上所有的代码都是C++和Python,其他语言一般只有几千行 .如果讲运行速度的部分,用C++,如果讲开发效率,用Python,谁会用Java这种高不成低不就的语言搞人工智能呢? Python虽然是脚本语言,但是因为容易学,迅速成为科学家的工具(MATLAB也能搞科学计算,但是软件要钱,且很贵),从而积累了大量的工具库.架构,人工智能涉及大量的数据计算,用Python是很自然的,简单高效. P

  • 为何人工智能(AI)首选Python?读完这篇文章你就知道了(推荐)

    为何人工智能(AI)首选Python?读完这篇文章你就知道了.我们看谷歌的TensorFlow基本上所有的代码都是C++和Python,其他语言一般只有几千行 .如果讲运行速度的部分,用C++,如果讲开发效率,用Python,谁会用Java这种高不成低不就的语言搞人工智能呢?Python虽然是脚本语言,但是因为容易学,迅速成为科学家的工具(MATLAB也能搞科学计算,但是软件要钱,且很贵),从而积累了大量的工具库.架构,人工智能涉及大量的数据计算,用Python是很自然的,简单高效.Python

  • Python入门教程(二十九)Python的RegEx正则表达式

    RegEx 或正则表达式是形成搜索模式的字符序列. RegEx 可用于检查字符串是否包含指定的搜索模式. RegEx 模块 Python 提供名为 re 的内置包,可用于处理正则表达式. 导入 re 模块: import re Python 中的 RegEx 导入 re 模块后,就可以开始使用正则表达式了: 实例 检索字符串以查看它是否以 “China” 开头并以 “country” 结尾: import re txt = "China is a great country" x =

  • windows上安装Anaconda和python的教程详解

    一提到数字图像处理编程,可能大多数人就会想到matlab,但matlab也有自身的缺点: 1.不开源,价格贵 2.软件容量大.一般3G以上,高版本甚至达5G以上. 3.只能做研究,不易转化成软件. 因此,我们这里使用Python这个脚本语言来进行数字图像处理. 要使用Python,必须先安装python,一般是2.7版本以上,不管是在windows系统,还是Linux系统,安装都是非常简单的. 要使用python进行各种开发和科学计算,还需要安装对应的包.这和matlab非常相似,只是matla

  • python安装教程 Pycharm安装详细教程

    python安装教程和Pycharm安装详细教程,分享给大家. 首先我们来安装python 1.首先进入网站下载:点击打开链接(或自己输入网址https://www.python.org/downloads/),进入之后如下图,选择图中红色圈中区域进行下载. 2.下载完成后如下图所示 3.双击exe文件进行安装,如下图,并按照圈中区域进行设置,切记要勾选打钩的框,然后再点击Customize installation进入到下一步: 4.对于上图中,可以通过Browse进行自定义安装路径,也可以直

  • Python基础教程之浅拷贝和深拷贝实例详解

    Python基础教程之浅拷贝和深拷贝实例详解            网上关于Python的深拷贝和浅拷贝的文章很多,这里对三种拷贝进行比较并附实例,大家可以参考下 一般的复制 #encoding:utf-8 #定义一个嵌套集合 lista=[1,2,3,[4,5,6,[7,8,9]]] listb=lista #分别打印出 lista和listb的地址值 print id(lista) #4511103096 print id(listb) #4511103096 #修改lista中的内容,li

  • Python 基础教程之闭包的使用方法

    Python 基础教程之闭包的使用方法 前言: 闭包(closure)是函数式编程的重要的语法结构.函数式编程是一种编程范式 (而面向过程编程和面向对象编程也都是编程范式).在面向过程编程中,我们见到过函数(function):在面向对象编程中,我们见过对象(object).函数和对象的根本目的是以某种逻辑方式组织代码,并提高代码的可重复使用性(reusability).闭包也是一种组织代码的结构,它同样提高了代码的可重复使用性. 不同的语言实现闭包的方式不同.Python以函数对象为基础,为闭

  • 安装Python的教程-Windows

    在开始Python编程前,需要先安装Python环境.Python安装包可以到Python的官网下载,官网地址是https://www.python.org/,如果想直接跳过关于Python的介绍相关直接下载安装包,则可以直接访问https://www.python.org/downloads/下载安装包即可. Windows下安装Python 要在Windows下安装Python,请按照下面的步骤进行: 1.打开Web浏览器,访问https://www.python.org/downloads

  • Python 基础教程之包和类的用法

    Python 基础教程之包和类的用法 建立一个文件夹filePackage 在filePackage 文件夹内创建 __init__.py 有了 __init__.py ,filePackage才算是一个包,否则只是算一个普通文件夹. 在filePackage 文件夹内创建 file.py file.py 代码如下: #!/usr/bin/env python3 # -*- coding: utf-8 -*- from datetime import datetime class MyFile(

随机推荐