Python中操作各种多媒体,视频、音频到图片的代码详解

2025-02-14 13:45:35

我们经常会遇到一些对于多媒体文件修改的操作，像是对视频文件的操作：视频剪辑、字幕编辑、分离音频、视频音频混流等。又比如对音频文件的操作：音频剪辑，音频格式转换。再比如我们最常用的图片文件，格式转换、各个属性的编辑等。因为多媒体文件的操作众多，本文选取一些极具代表性的操作，以代码的形式实现各个操作。

一、图片操作

操作图片的模块有许多，其中比较常用的两个就是 Pillow 和 opencv ,两个模块各有优势。其中 opencv 是计算机视觉处理的开源模块，应用的范围更加广泛，从图像处理到视频处理，再到物体检测等。而 pillow 相比直线就单纯的多，其大多数操作都是围绕图像而展开的。

1.1、格式转换

图片格式有多种多样，最直观的感受就是图片后缀。而格式之间的差异不仅仅是后缀的差异，最为明显的就是 png 格式图片，同其它图片有着最为直观的区别。下面我们就看看在Python中如何转换格式，我们先安装 pillow 模块：

pip install pillow

然后看看如何导入模块以及如何读取图像：

from PIL import Image
# 读取图像
img = Image.open('ycjc.jpg')
# 显示图像
img.show()

我们有了上面的基础操作之后，就可以开始进行格式转换了，我们用有村大妹子的图片作为素材：

我们可以看到这是一张白色背景的图片，我们将它转成 png 看看效果：

from PIL import Image
# 读取图像
img = Image.open('ycjc.jpg')
# 格式转换，其中A为透明度
png = img.convert('RGBA')
# 保存图像，因为是RGBA格式，所以后缀应该为png
png.save('ycjc.png')

输出的图片我就不放了，我们观察输出图片会发现，白色背景好像变透明了。不要怀疑，这只是心理作用，其实图片看上去是不会有任何变化的。但是实际上图片从原来的 RGB 三个色道变成了 RGBA 四个色道，我们会发现，图片变大了：

虽然 A 色道的透明度全部都是0，但是实际上还是存在这个色道，所以大小方面有了明显的增加。更多转换模式可以参考超全Python图像处理讲解（多图预警）。

1.2、图片裁剪

图片裁剪的操作也非常常用，我们来看看 pillow 如何裁剪图片：

from PIL import Image
# 读取图像
img = Image.open('ycjc.jpg')
# 裁剪图像，调用crop方法，传入裁剪区域的元组
img_crop = img.crop((100, 100, 400, 400))
# 保存裁剪后的图像
img_crop.save('ycjc_crop.jpg')

我们调用 crop 方法，传入裁剪区域的元组进行裁剪，元组的内容为左上角的坐标（前两个参数）即右下角的坐标（后两个参数）。效果图如下：

1.3、截屏

虽然算不上是图像操作，但是还是个非常实用的操作。我们实现截屏是通过ImageGrap类实现的：

from PIL import ImageGrab
# 截取全屏
im = ImageGrab.grab()
# 保存图像
im.save('win.png')

除了截取全屏我们也可以区域截屏：

im =ImageGrab.grab((300, 100, 1400, 600))

参数元组含义与 crop 方法一致。

除了上述操作，还有更多像是添加滤镜、对比度调节、亮度调节、色彩调节等，由于内容众多，所以不在本文详细讨论。

二、音频操作

音频的操作也比较繁多，我们最常用到的就是音频剪辑和音量调节了。我们这里使用 pydub 模块来进行音频文件的操作。

2.1、pydub的安装以及读取音频

安装我们还是使用pip：

pip install pydub

然后我们来读取一个 wav 文件：

from pydub import AudioSegment
# 读取wav格式的音频文件
music = AudioSegment.from_wav('百年孤独.wav')

这样我们就完成了音频文件的读取， wav 文件是一种未经压缩的文件，我们可以通过 pydub 直接读取。读取其它类型的文件 pydub 同样提供了相应的方法：

music = AudioSegment.from_mp3('music.mp3')
music = AudioSegment.from_ogg("music.ogg")
music = AudioSegment.from_flv("music.flv")

因为在实际操作过程中遇到了一个未找明缘由的错误，所以本文的音频操作只针对 wav 格式。

2.2、音频剪切

音频剪辑的实现我们是通过类似ndarray的中括号操作的：

# 截取前20秒
clip = music[:20*1000]
# 截取后20秒
clip = music[-20000:]
# 从第20秒截取到第40秒
clip = music[20*1000:40*1000]

剪切好的片段我们可以另外存一个文件：

# 保存文件为clip.mp3，格式为mp3
clip.export('clip.mp3', format='mp3')

3.3、增加/减少音量

音量的控制我们只需要用音频对象加一个常数即可：

# 音量减5
music -= 5
# 音量加5
music += 5

3.4、音频拼接

我们先看看重复拼接：

# 在音频文件末尾重复拼接该音频
music = music*2

拼接后的音频的效果就是原音频循环两次。接下来我们看看拼接不同的音频：

# 裁剪前20秒音频
clip1 = music[:20*1000]
# 裁剪后20秒音频
clip2 = music[-20*1000:]
# 拼接音频
clip = clip1 + clip2

3.5、交叉渐入渐出

交叉渐入渐出是一种比较柔和的音频转场方式，在两个音频切换的间歇会有一个重合，用代码实现如下：

# 截取前20秒
begin = music[20*1000:40*1000]
# 截取后20秒
end = music[-20*1000:]
# 添加交叉渐入渐出 效果
clip = begin.append(end, crossfade=1500)

我们可以看到我们一共裁剪了40秒，在生成的文件我们可以看到只有38秒，因为转场的时候有个重合的效果。当然还有更多的操作，大家可以自己去了解。

三、视频操作

视频的操作可以通过 moviepy 和 opencv 进行，我们先分别安装两个模块：

pip install opencv-python
pip install moviepy

3.1、视频剪辑

相比之下 moviepy 操作视频要更便利，我们看看使用 moviepy 如何剪辑视频：

from moviepy.editor import *
# 剪切视屏bws.mp4中第50秒到第60秒
clip = VideoFileClip('bws.mp4').subclip(50, 60)
# 将剪切的片段保存
clip.write_videofile("clip.mp4")

3.2、提取音频文件

在 VideoFileClip 类中，音频文件作为其中的一个参数，我们可以直接获取：

from moviepy.editor import *
# 读取视频文件
video = VideoFileClip('bws.mp4')
# 获取其中音频
audio = video.audio
# 保存音频文件
audio.write_audiofile('audio.mp3')

3.3、混流

我们还可以将音频同视频混流，在moviepy中，提供了一个读取音频文件的类，我们设置视频的音频需要创建这个类的对象：

from moviepy.editor import *
# 读取视频
video = VideoFileClip('bws.mp4')
# 读取音频
audio = AudioFileClip('百年孤独.mp3')
# 设置视频的音频
video = video.set_audio(audio)
# 保存新的视频文件
video.write_videofile('bws_audio.mp4')

3.4、逐帧提取画面

我们都知道，视频是由一帧一帧的图片组成的，我们也可以将画面一帧一帧提取出来：

import cv2
# 读取视频
video = cv2.VideoCapture('bws.mp4')
# 逐帧读取，当还有画面时ret为True，frame为当前帧的ndarray对象
ret, frame = video.read()
i = 0
# 循环读取
while ret:
 i += 1
 cv2.imwrite('v'+str(i) + '.jpg', frame)
 ret, frame = video.read()

上述代码就能将视屏的每一帧以图片的形式保存下来。

3.5、截取gif

截取gif和截取视频没有什么区别，不过为了减少gif的大小，我们通常会对视频进行尺寸缩放：

from moviepy.editor import *
# 读取视频
video = VideoFileClip('bws.mp4')
# 裁剪视频，并缩小一半
video = video.subclip(20, 30).resize((0.5))
# 保存gif图片
video.write_gif('bws.gif')

在上面subclip方法中，我们可以传入元组，例如：

video.subclip((1, 20), (2, 30))

其含义为从1分20秒截取到2分30秒。

总结

到此这篇关于Python中操作各种多媒体,视频、音频到图片的代码详解的文章就介绍到这了,更多相关python多媒体视频音频图片内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

利用Python小工具实现3秒钟将视频转换为音频

最近,有读者微信上私聊我,想让我写一篇视频批量转换成音频的文章,我答应了,周末宅家里把这个小工具做出来了. 这样,对于有些视频学习文件,我们可以批量转换成音频文件,学习方式更多样化了. 之前也用过 ffmpeg 处理视频文件.ffmpeg 这个程序处理视频是好用,但是有没有更轻便的呢?可以不下载这个程序吗?还真有,Python 里有 ffmpeg 相关的库:ffmpy3. ffmpy3 是 ffmpy 的一个分支,它是一个简单的 FFmpeg 命令行包装程序.ffmpy 实现了一个 Python
Python一键查找iOS项目中未使用的图片、音频、视频资源

前言在iOS项目开发的过程中,如果版本迭代开发的时间比较长,那么在很多版本开发以后或者说有多人开发参与以后,工程中难免有一些垃圾资源,未被使用却占据着api包的大小! 这里我通过Python脚本来查找项目中未被使用的图片.音频.视频资源,然后删除掉:以达到减小APP包大小的目的! 代码先查找项目中所以的资源文件存到你数组里面 def searchAllResName(file_dir): global _resNameMap fs = os.listdir(file_dir) for dir
python基于http下载视频或音频

一.简介这里介绍使用python基于http下载视频或音频. 二.关键点 1.断点续传视频或音频文件一般比较大,所以通过需要断点续传.方式通过在http的header里添加Range字段,指示接下来需要接收文件的位置. 2.判断结束这里采用读取response的content-length字段,若当前报文长度小于前次报文长度,或者已接收文件等于当前报文长度,则可以认为视频接收完成. 三.示例代码 import os import requests def do_load_media(url
Python中操作各种多媒体,视频、音频到图片的代码详解

我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑.字幕编辑.分离音频.视频音频混流等.又比如对音频文件的操作:音频剪辑,音频格式转换.再比如我们最常用的图片文件,格式转换.各个属性的编辑等.因为多媒体文件的操作众多,本文选取一些极具代表性的操作,以代码的形式实现各个操作. 一.图片操作操作图片的模块有许多,其中比较常用的两个就是 Pillow 和 opencv ,两个模块各有优势.其中 opencv 是计算机视觉处理的开源模块,应用的范围更加广泛,从图像处理到视频处理
Python中pandas dataframe删除一行或一列:drop函数详解

用法:DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False) 在这里默认:axis=0,指删除index,因此删除columns时要指定axis=1: inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新dataframe: inplace=True,则会直接在原数据上进行删除操作,删除后就回不来了. 例子: >>>df = pd.DataFrame(np.a
对python中list的拷贝与numpy的array的拷贝详解

1.python中列表list的拷贝,会有什么需要注意的呢? python变量名相当于标签名. list2=list1 ,直接赋值,实质上指向的是同一个内存值.任意一个变量list1(或list2)发生改变,都会影响另一个list2(或list1). eg: >>> list1=[1,2,3,4,5,6] >>> list2=list1 >>> list1[2]=88 >>> list1 [1, 2, 88, 4, 5, 6] >
对python中不同模块(函数、类、变量)的调用详解

首先,先介绍两种引入模块的方法. 法一:将整个文件引入 import 文件名文件名.函数名( ) / 文件名.类名通过这个方法可以运行另外一个文件里的函数法二:只引入某个文件中一个类/函数/变量需要从某个文件中引入多个函数或变量时,用逗号隔开即可 from 文件名 import 函数名,类名,变量名接下来,通过一个具体的例子说明引入模块的具体方法: 假设新建一个python包test2,里边有一个名为run.py的python文件,run.py文件里有一个名为running()的函数
对Python中创建进程的两种方式以及进程池详解

在Python中创建进程有两种方式,第一种是: from multiprocessing import Process import time def test(): while True: print('---test---') time.sleep(1) if __name__ == '__main__': p=Process(target=test) p.start() while True: print('---main---') time.sleep(1) 上面这段代码是在window
对python中词典的values值的修改或新增KEY详解

在python中,对词典的值,可以新增,或者修改,如下: 以上这篇对python中词典的values值的修改或新增KEY详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
对Python中实现两个数的值交换的集中方法详解

如下所示: #定义两个数并赋值 x = 1 y = 2 #第1种方式:引入第三方变量 z = 0 z = x x = y y = z #第2种:不引入第三方变量 x = x+y y = x-y x = x-y #第3种:推荐 x,y = y,x print("x=%d,y=%d"%(x,y)) 以上这篇对Python中实现两个数的值交换的集中方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
python中的split()函数和os.path.split()函数使用详解

Python中有split()和os.path.split()两个函数: split():拆分字符串.通过指定分隔符对字符串进行切片,并返回分割后的字符串列表. os.path.split():将文件名和路径分割开. 1.split()函数语法:str.split(str=" ",num=string.count(str))[n] 参数说明: str: 表示为分隔符,默认为空格,但是不能为空串.若字符串中没有分隔符,则把整个字符串作为列表的一个元素. num:表示分割次数.如果存在参
关于Python 中的时间处理包datetime和arrow的方法详解

在获取贝壳分的时候用到了时间处理函数,想要获取上个月时间包括年.月.日等 # 方法一: today = datetime.date.today() # 1. 获取「今天」 first = today.replace(day=1) # 2. 获取当前月的第一天 last_month = first - datetime.timedelta(days=1) # 3. 减一天,得到上个月的最后一天 print(last_month.strftime("%Y%m")) # 4. 格式化成指定形
python类的方法属性与方法属性的动态绑定代码详解

动态语言与静态语言有很多不同,最大的特性之一就是可以实现动态的对类和实例进行修改,在Python中,我们创建了一个类后可以对实例和类绑定心的方法或者属性,实现动态绑定. 最近在学习python,纯粹是自己的兴趣爱好,然而并没有系统地看python编程书籍,觉得上面描述过于繁琐,在网站找了一些学习的网站,发现廖雪峰老师的网站上面的学习资源很不错,而且言简意赅,提取了一些python中的重要的语法和案例.重要的是可以在线测试python的运行代码,缺点就是没有系统的看python的书籍,不能及时的将

Python中操作各种多媒体,视频、音频到图片的代码详解

相关推荐

随机推荐