Python使用ffmpeg合成视频、音频的实现方法

2025-02-19 06:13:28

最近有在使用屏幕录制软件录制桌面，在用的过程中突发奇想，使用python能不能做屏幕录制工具，也锻炼下自己的动手能力。
接下准备写使用python如何做屏幕录制工具的系列文章：

录制屏幕制作视频录制音频

合成视频，音频

基于pyqt5制作可视化窗口

大概上述四个部分，希望自己能够尽快完善，前两篇文章分享了利用opencv制作了屏幕录制部分，利用PyAudio录制音频，本篇文章分享如何使用ffmpeg将同时录制的屏幕录像和音频合成为有声音的屏幕录像。

应用平台

windows 10
python 3.7
ffmpeg

音视频合成

在python合成音视频有很多第三方包，操作方法各有不同，有简易的也有稍微复杂的，

起初也有想过使用moviepy中文文档，其在使用门槛上确实比ffmpeg要小很多，在翻查相关资料后，目前要考虑的事是合并音视频为一个有声音的视频，而且ffmpeg具有录制视频的功能，效果比使用cv2+ImageGrab方式要好，所以采用ffmpeg作为合成工具，ffmpeg.exe下载路径，使用手册。

python下使用ffmpeg，可以直接调用命令行工具，也可以使用封装的第三包。

pip install ffmpeg-python

使用参数与ffmpeg一致，不同处在于，在使用完后需要键入终止条件以结束ffmpeg的运行。

将cv2的屏幕录制改成ffmpeg录制

import ffmpeg

# 屏幕录制画面大小
width = 1920
height = 1080
# 录制帧率，在cv2录制中，发现帧率比较固定且偏小，主要原因为ImageGrab间隔时间稍长
# 这里可以调整的稍微大一点，当然越大对固件性能越好，推荐在15~60之间（含）
fps = 30
# 录制画面是否包含鼠标，0：不包含，1：包含
# 录制方式为gdigrab模式，包含鼠标在录制过程会看到鼠标频闪的现象，可自行搜索模块插件解决
draw_mouse = 0
# 屏幕画面录制偏移距离
offset_x = 0
offset_y = 0
# 文件名称
filename = 'test.mp4'
# 录制桌面
process = (
            ffmpeg.output(
                ffmpeg.input(
                    filename='desktop', format='gdigrab', framerate=fps, offset_x=offset_x, offset_y=offset_y,
                    draw_mouse=draw_mouse, s=f'{width}x{height}'),
                filename=filename, pix_fmt='yuv420p'
            ).overwrite_output()
        )
# cmd: ffmpeg路径，如不设置，会搜寻环境变量下的ffmpeg
# 可直接下载ffmpeg.exe到工程文件目录下
ffmpeg_path = 'ffmpeg.exe'
process.run_async(cmd=ffmpeg_path, pipe_stdin=True, pipe_stdout=False, pipe_stderr=False)
# 自定义延时函数
delay()
# 传入中断参数，在调用之前，尽量在之前有足够的延时
process.communicate(str.encode("q"))
process.terminate()

合成音视频

# 传入的视频路径
video_path = 'mp4_test.mp4'
# 传入的音频路径
audio_path = 'mp3_test.mp3'
# 生成的视频名称，不要和上述的路径一致
output_path = 'mixer.mp4'

process = (
            ffmpeg.output(
                ffmpeg.input(filename=video_path),
                ffmpeg.input(filename=audio_path),
                filename=output_path, vcodec='copy', acodec='aac', strict='experimental', pix_fmt='yuv420p'
            ).overwrite_output()

ffmpeg_path = 'ffmpeg.exe'
process.run_async(cmd=ffmpeg_path, pipe_stdin=True, pipe_stdout=False, pipe_stderr=False)

time.sleep(1)
process.communicate(str.encode("q"))
process.terminate()

ps: 上述方法也可以封装到类中，方便pyqt5窗口的实现。

看到这里可能会想到，有音频录制，视频录制，音视频合成，但是不好让音视频分开录制，导致音视频不同步，看起来也别扭，下面就来实现将两者同时录制同时结束。

可沿用录制屏幕制作视频（推荐用本篇下方的代码），录制音频两篇里的代码，将关于键盘监听部分注释掉，避免冲突。

from threading import Thread
from pynput import keyboard
from Audio_record import AudioRecord
from Screenshot_record import Screenshot

def hotkey():
    """热键监听"""
    with keyboard.Listener(on_press=on_press) as listener:
        listener.join()
def on_press(key):
    try:
        video.terminate()
        if key.char == 't':  # t键，录制结束，保存音视频
            audio.stop_flag = True
        elif key.char == 'k':  # k键，录制中止，删除文件
            audio.kill = True
            video.unlink('test.mp4')
    except Exception as e:
        print(e)
key_thread = Thread(target=hotkey, daemon=True)
audio = AudioRecord()
video = Screenshot()
key_thread.start()
audio.run(filename='test.mp3')
video.record('test.mp4')

利用三组线程，当该代码运行时就会监听键盘按键，同时录制音频、视频，当按下t键结束录制，保存音视频。

总结

通过音视频分线程录制，保证两个文件的时长一致且同步的情况，在这过程中学习了如何在python中调用ffmpeg模块，对此进行音视频合并，完成视频合成。

远处的峰亦不能遮挡看到山后的风景。

于二零二二年四月十七日作

ffmpeg录屏源代码：

"""
Screenshot_record.py 使用ffmpeg录制屏幕
from pathlib import Path
import ffmpeg

class Screenshot:
    def __init__(self, width=1920, height=1080, fps=15):
        self.width = width
        self.height = height
        self.fps = fps
        self.process = None
        self.ffmpeg_path = file_path('ffmpeg.exe')
    def __call__(self, width, height, fps=None):
        self.fps = fps if fps else self.fps
    @staticmethod
    def unlink(filename):
        Path(filename).unlink()
    def record(self, filename, offset_x=0, offset_y=0, draw_mouse=0):
        self.process = (
            ffmpeg.output(
                ffmpeg.input(
                    filename='desktop', format='gdigrab', framerate=self.fps, offset_x=offset_x, offset_y=offset_y,
                    draw_mouse=draw_mouse, s=f'{self.width}x{self.height}'),
                filename=filename, pix_fmt='yuv420p'
            ).overwrite_output()
        )
        self.ffmpeg_async()
    def compose_audio(self, video_path, audio_path, output_path):
                ffmpeg.input(filename=video_path),
                ffmpeg.input(filename=audio_path),
                filename=output_path, vcodec='copy', acodec='aac', strict='experimental', pix_fmt='yuv420p'
    def ffmpeg_async(self):
        self.process = self.process.run_async(cmd=self.ffmpeg_path, pipe_stdin=True, pipe_stdout=False,
                                              pipe_stderr=False)
    def terminate(self):
        if self.process is not None:
            self.process.communicate(str.encode("q"))
            self.process.terminate()
            self.process = None

到此这篇关于Python使用ffmpeg合成视频、音频的文章就介绍到这了,更多相关python ffmpeg合成视频音频内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码

安装官网下载 http://ffmpeg.org/ 选择需要的版本在这个网址下载ffmpeg,https://github.com/BtbN/FFmpeg-Builds/releases 将解压后得到的以下几个文件放置在E:\FFmpeg下环境变量此电脑--属性--高级系统设置--环境变量在系统变量(也就是下面那一半)处找到新建,按如下所示的方法填写再将%FFMPEG_HOME%以及%FFMPEG_HOME%\bin写入系统变量的Path中然后一路确定即可验证 win+R,cmd
利用python+ffmpeg合并B站视频及格式转换的实例代码

利用python+ffmpeg合并B站视频及格式转换 B站客户端下载的视频一般有两种格式:早期的多为blv格式(由flv格式转换而来,音视频轨道在同一文件下). 如今的多为m4s格式,音频轨视频轨分开以下为利用ffmpeg简单对文件处理,使其转换为大多数播放器能正常播放的mp4格式前提:已正常安装ffmpeg import tkinter as tk from tkinter import filedialog import os import tkinter.messagebox from
Python使用ffmpeg合成视频、音频的实现方法

最近有在使用屏幕录制软件录制桌面,在用的过程中突发奇想,使用python能不能做屏幕录制工具,也锻炼下自己的动手能力.接下准备写使用python如何做屏幕录制工具的系列文章: 录制屏幕制作视频录制音频合成视频,音频基于pyqt5制作可视化窗口大概上述四个部分,希望自己能够尽快完善,前两篇文章分享了利用opencv制作了屏幕录制部分,利用PyAudio录制音频,本篇文章分享如何使用ffmpeg将同时录制的屏幕录像和音频合成为有声音的屏幕录像. 应用平台 windows 10 python 3
python利用ffmpeg进行录制屏幕的方法

前几天下载了几个视频,但是有两集是一个视频的,偶尔找到了ffmpeg处理视频的方法,它的功能非常强大.因此,分享一下,一起学习. import subprocess,sys,os import re class CutSplicingVdeio(object): def __init__(self): pass #dercription CutSplicingVdeio this class function def instructions(self): dercription="vdeio
Python 利用pydub库操作音频文件的方法

最近使用Python调用百度的REST API实现语音识别,但是百度要求音频文件的压缩方式只能是pcm(不压缩).wav.opus.speex.amr,这里面也就wav还常见一点,但是一般设备录音得到的文件都是mp3,这就要把mp3转换为wav,由于python的效率并不高,很多实现都是使用C++或者Java,不过GitHub上有一个项目pydub(https://github.com/jiaaro/pydub/tree/master/pydub)可以暂时解决问题. 安装pydub 直接执行以下
java使用FFmpeg合成视频和音频并获取视频中的音频等操作(实例代码详解)

FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序. ffmpeg命令参数如下: 通用选项 -L license -h 帮助 -fromats 显示可用的格式,编解码的,协议的... -f fmt 强迫采用格式fmt -I filename 输入文件 -y 覆盖输出文件 -t duration 设置纪录时间 hh:mm:ss[.xxx]格式的记录时间也支持 -ss position 搜索到指定的时间 [-]hh:mm:ss[.xxx]的格式也支持 -title
使用ffmpeg 合并aac格式音频文件的方法

FFmpeg简介 FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序.采用LGPL或GPL许可证.它提供了录制.转换以及流化音视频的完整解决方案.它包含了非常先进的音频/视频编解码库libavcodec,为了保证高可移植性和编解码质量,libavcodec里很多code都是从头开发的. FFmpeg在Linux平台下开发,但它同样也可以在其它操作系统环境中编译运行,包括Windows.Mac OS X等.这个项目最早由Fabrice Bellard发起,2004
利用python和ffmpeg 批量将其他图片转换为.yuv格式的方法

由于跑编码的需要,所以需要制作一个.yuv格式的图片数据集,但是手头只有.jpg格式的,故记录下转换过程.其他图片格式也可以,代码里修改一下就行. ①安装ffmpeg 官网(各种版本):ffmepg官网 window版:https://ffmpeg.zeranoe.com/builds/ ②安装ffmpeg的python3接口ffmpy3 在命令行中输入以下命令: pip install ffmpy3 ③将下载好的windows版解压,把ffmpeg.exe复制到你将要跑python代码的文件夹
使用Java和ffmpeg把音频和视频合成视频的操作方法

FFmpeg是一个开源免费跨平台的视频和音频流方案,属于自由软件,采用LGPL或GPL许可证(依据你选择的组件).它提供了录制.转换以及流化音视频的完整解决方案.它包含了非常先进的音频/视频编解码库libavcodec,为了保证高可移植性和编解码质量,libavcodec里很多codec都是从头开发的. FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序.它包括了目前领先的音/视频编码库libavcodec. FFmpeg是在Linux下开发出来的,但它可以在包
python对批量WAV音频进行等长分割的方法实现

对批量WAV音频进行等长分割对WAV格式的音频以相同长度进行分割. import os import wave import numpy as np import pylab as plt import librosa path = r"D:\cutaudio\test" files = os.listdir(path) files = [path + "\\" + f for f in files if f.endswith('.wav')] CutTime =
Mac上Python使用ffmpeg完美解决方案(避坑必看!)

目录一.在系统中安装ffmpeg 二.配置环境变量三.在Python中安装ffmpeg 四.配置文件让Python能够使用总结近期有个需要进行音频转码的小任务需要用到ffmpeg,安装和使用的过程中遇到了很多问题没有办法解决,从网上找了各种教程也是一言难近,本文二哥来梳理一下从0到1在Mac上使用ffmpeg. 一.在系统中安装ffmpeg 第一步需要在系统中安装ffmpeg,很多人都给出了使用brew命令进行下载的方案,在此说一下,多数人brew后都需要等n分钟,最后以报错告终,这种外
Python基于pygame模块播放MP3的方法示例

本文实例讲述了Python基于pygame模块播放MP3的方法.分享给大家供大家参考,具体如下: 安装pygame(可参考:安装Python和pygame及相应的环境变量配置) pip安装这个whl文件装完就直接跑代码啦,很短的 import time import pygame file=r'C:\Users\chan\Desktop\Adele - All I Ask.mp3' pygame.mixer.init() print("播放音乐1") track = pygame.m

Python使用ffmpeg合成视频、音频的实现方法

应用平台

音视频合成

合成音视频

总结

相关推荐

随机推荐