Python OpenCV视频文件相关操作教程
目录
- 一、从文件中读取视频并播放
- 1.创建读取视频的对象
- 2.获取视频某些属性
- 3.修改视频属性信息
- 4.判断图像是否读取成功
- 5.获取视频的一帧图像
- 6.释放图像
- 二、视频文件的保存
- 1.在OpenCV中保存视频使用的是VedioWriter对象,创建视频写入对象
- 2.设置视频的编解码器
- 3.利用cap.read()获取视频中的每一帧图像,使用out.write()将某一帧图像写入视频中
- 4.使用cap.release()和out.release()释放资源
- 三、视频文件目标追踪
- 1.meanshift算法:
- 2>API
- 3>主要流程
- 总结
一、从文件中读取视频并播放
1.创建读取视频的对象
cap=cv.VideoCapture(filepath)
2.获取视频某些属性
retval=cap.get(propId)
propId:从0到18的数字,每个数字表示视频的属性
索引 | flags | 意义 |
0 | cv2.CAP_ PROP_POS_MSEC | 视频文件当前位置 |
1 | cv2.CAP_PROP_POS_FRAMES | 从0开始索引帧,帧位置 |
2 | cv2.CAP_PROP_POS_AVI_RATIO | 视频文件的相对位置(0表示开始,1表示结束) |
3 | cv2.CAP_PROP_FRAME_WIDTH | 视频流的帧宽度 |
4 | cv2.CAP_PROP_FRAME_HEIGHT | 视频流的帧高度 |
5 | cv2.CAP_PROP_FPS | 帧率 |
6 | cv2.CAP_PROP_FOURCC | 编解码器四字符代码 |
7 | cv2.CAP_PROP_FRAME_COUNT | 视频文件的帧 |
3.修改视频属性信息
cap.set(propId,value)
4.判断图像是否读取成功
isornot=cap.isOpened()
5.获取视频的一帧图像
ret,frame=cap.read()
ret:获取成功返回True,失败返回False
frame:获取到的图像
注意:调用cv.imshow()显示图像时,要使用cv.waitkey()设置适当持续时间,通常设置25ms
6.释放图像
cap.release()
示例:
import numpy as np import cv2 as cv cap=cv.VideoCapture("video.mp4") #判断是否获取成功 while(cap.isOpened()): #获取每一帧图像 ret,frame=cap.read() #是否获取成功 if ret == True: cv.imshow("frame",frame) if cv.waitKey(25)&0xFF==ord("q"): break; cap.release() cv.destoryAllWindows()
二、视频文件的保存
1.在OpenCV中保存视频使用的是VedioWriter对象,创建视频写入对象
out=cv.VideoWriter(filename,fourcc,fps,framesize)
fourcc:用四个字符表示的视频编码格式
fps:帧速率
framesize:每一帧的大小
2.设置视频的编解码器
retval=cv2.VideoWriter_fourcc(c1,c2,c3,c4)
c1~c4:视频编解码器的4字节代码,常用的有:
Windows:DIVX(.avi)
OS中:MJPG(.mp4),DIVX(.avi),X264(.mkv)
3.利用cap.read()获取视频中的每一帧图像,使用out.write()将某一帧图像写入视频中
4.使用cap.release()和out.release()释放资源
示例
import numpy as np import cv2 as cv #读取视频 cap=cv.VideoCapture("video.mp4") width=int(cap.get(3)) height=int(cap.get(4)) out=cv.VideoWriter("out.avi",cv.VideoWriter_fourcc("M","J","P","G"),10,(width,height)) while(True): ret,frame=cap.read() if ret==True: out.write(frame) else: break cap.release() out.release() cv.destroyAllWindows()
三、视频文件目标追踪
1.meanshift算法:
1>原理:通常情况,使用直方图反向投影方法将窗口移动到反向投影图像中灰度密度最大的区域
假设我们有张100x100的输入图像,有一张10x10的模板图像, 查找的过程:
1.从输入图像的左上角(0,0)开始,切割一块(0,0)至(10,10)的临时图像2.生成临时图像的直方图
3.用临时图像的直方图和模板图像的直方图对比,对比结果记为c
4.直方图对比结果c,就是结果图像(0,0)处的像素值
5.切割输入图像从(0,1)至(10,11)的临时图像,对比直方图,并记录到结果图像6.重复1~5步直到输入图像的右下角,就形成了直方图的反向投影
2>API
cv.meanshift(probImage,window,criteria)
probImage:ROI区域,即直方图的反向投影
window:初始搜索窗口,即定义ROI的rect
criteria:确定窗口搜索停止的准则,主要有迭代次数达到设置的最大值,窗口中心漂移值大于某个设定的限值
3>主要流程
1.读取视频文件: cv.VideoCapture0
2.感兴趣区域设置:获取第一帧图像,并设置目标区域,即感兴趣区域
3.计算直方图:计算感兴趣区域的HSV直方图,并进行归一化
4.目标追踪:设置窗口搜索停止条件,直方图反向投影,进行目标追踪,并在目标位置绘制矩形框。
示例
import numpy as np import cv2 as cv # 1.获取图像 cap=cv.VideoCapture('video.mp4') #指定追踪目标 ret,frame=cap.read() #行、高、列、宽 r,h,c,w=347, 301, 700, 308 win=(c,r,w,h)#追踪窗口为列行宽高 #追踪目标 roi = frame[r:r + h, c:c + w] #计算直方图(HSV) hsv_roi=cv.cvtColor(roi, cv.COLOR_BGR2HSV) roi_hist=cv.calcHist([hsv_roi], [0], None, [180], [0, 180]) cv.normalize(roi_hist,roi_hist,0,255,cv.NORM_MINMAX) # 4. 目标追踪,设置窗口搜索终止条件:最大迭代次数,窗口中心漂移最小值 term=(cv.TERM_CRITERIA_EPS|cv.TERM_CRITERIA_COUNT, 10, 1) while (True): ret, frame=cap.read() if ret == True: #计算直方图的反向投影 hsv=cv.cvtColor(frame, cv.COLOR_BGR2HSV) dst=cv.calcBackProject([hsv],[0],roi_hist,[0, 180],1) #进行meanshift追踪 ret,win = cv.meanShift(dst,win,term) #追踪的位置绘制在视频上 x,y,w,h=win img2 = cv.rectangle(frame, (x,y), (x+w, y+h), 255, 2) cv.imshow('frame',img2) if cv.waitKey(60) & 0xFF == ord('q'): break else: break cap.release() cv.destroyAllWindows()
总结
到此这篇关于Python OpenCV视频文件相关操作的文章就介绍到这了,更多相关OpenCV视频文件操作内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!