Python从视频中提取音频的操作
简介
OpenCV中使用VideoCapture类写的视频是没有音频的,如果要进一步处理音频则需要用到一个库——MoviePy,这个库是Python视频编辑库,可裁剪、拼接、标题插入、视频合成、视频处理和自定义效果。
安装
pip install moviepy
代码
from moviepy.editor import * video = VideoFileClip('test.mp4') audio = video.audio audio.write_audiofile('test.mp3')
不安装moviepy视频编辑库可以直接使用ffmpeg-python库,见参考文献4,代码稍微复杂点
音频格式
extensions_dict = { "mp4": {'type':'video', 'codec':['libx264','libmpeg4', 'aac']}, 'ogv': {'type':'video', 'codec':['libtheora']}, 'webm': {'type':'video', 'codec':['libvpx']}, 'avi': {'type':'video'}, 'mov': {'type':'video'}, 'ogg': {'type':'audio', 'codec':['libvorbis']}, 'mp3': {'type':'audio', 'codec':['libmp3lame']}, 'wav': {'type':'audio', 'codec':['pcm_s16le', 'pcm_s24le', 'pcm_s32le']}, 'm4a': {'type':'audio', 'codec':['libfdk_aac']} }
可看到支持ogg、mp3、wav和m4a四种格式,个人测试m4a输出失败,建议只用mp3和wav
测试2分钟的视频导出mp3为1.83Mb,wav为20.1Mb
mp3是有损格式,wav是无损格式,按需选择
备注
要实现更底层的音视频处理应用ffmpeg
补充:python处理mp4视频提取音频转为mp3或者wav,并进行截取
mp4视频文件提取音频转为mp3或者wav文件
mp3是有损文件,wav是无损文件,就像我测试的视频,mp3导出只有几十k,wav文件导出有3M多。
from moviepy.editor import * video = VideoFileClip('aa.mp4') audio = video.audio audio.write_audiofile('test.wav') audio.write_audiofile('test.mp3')
截取map或者wav文件
from scipy.io import wavfile like = wavfile.read('test.wav') # print (like) # 音频结果将返回一个tuple。第一维参数是采样频率,单位为秒;第二维数据是一个ndarray表示歌曲,如果第二维的ndarray只有一个数据表示单声道,两个数据表示立体声。所以,通过控制第二维数据就能对歌曲进行裁剪。 # 对like这个元组第二维数据进行裁剪,所以是like[1];第二维数据中是对音乐数据切分。 start_s表示你想裁剪音频的起始时间;同理end_s表示你裁剪音频的结束时间。乘44100 是因为每秒需要进行44100次采样 # 这里表示对该音频的13-48秒进行截取 wavfile.write('test2.wav',44100,like[1][13*44100:48*44100])
以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。如有错误或未考虑完全的地方,望不吝赐教。
赞 (0)