Python实现FLV视频拼接功能

2025-04-02 14:45:20

文章摘要

本文简单说明了FLV文件的格式，以此为出发点，使用 Python 实现FLV视频的拼接。

一.FLV文件格式

关于FLV文件格式的解析网上有诸多文章，在这里就简单介绍一下需要了解的部分，以便读者更好地明白各段代码的功能。

FLV文件是由文件头(Header)和文件体(Body)按顺序拼接而成。审查FLV内容时，以二进制方式读取内容。

Header：文件头表明了文件的封装格式为FLV，存储对象为音频、视频或两者。
以下为FLV文件的Header，共 9 个字节：

b'FLV\x01\x05\x00\x00\x00\t'
前 3 个字节(FLV)说明这是一个FLV文件
第 4 个字节(\x01)为版本号，固定为 1
第 5 个字节(\x05)表明存储对象，需将其转化成二进制(00000101)查看，左、右边的 1 分别表示文件含有音频和视频
后 4 个字节(\x00\x00\x00\t)表示文件头的长度，其值固定为 9

Body：文件体由若干个 Tag 组成，除了第一个，每个 Tag 是由头部( 11 字节)、主体(不定长)和尾部( 4 字节)组成。第一个 Tag 只有尾部。

Tag 又分为 3 类，脚本(scripts)、音频(audio)和视频(video)。通常第 2 个 Tag 为脚本类型，且只有一个，后续的都是音视频类型。

以下为脚本 Tag 的部分，作为示例介绍一下：

头部：b'\x12\x00\tb\x00\x00\x00\x00\x00\x00\x00'
第 1 个字节(\x12)表示 Tag 类型，脚本类型的对应值为 18 ，音频为 8 ，视频为 9
第 2-4 个字节(\x00\tb)表示 Tag 主体的长度，此处为 2402
第 5-7 个字节(\x00\x00\x00)为时间戳，脚本类型的时间戳通常为 0
第 8 个字节(\x00)是时间戳的扩展，当前 3 个字节不够用时会用这个字节当作大端
后 3 个字节(\x00\x00\x00)是 Stream id，固定为 0

主体：脚本 Tag 的主体包含FLV视频的基本信息，如时长、大小、分辨率等，比较复杂，在此不作介绍

尾部：b'\x00\x00\tm'

固定 4 字节，表示 Tag 头部加主体的长度，即 11 + 2402 = 2413

二.FLV视频拼接

将多个FLV视频合成一个可以正常播放的视频，便足够满足大部分的需求。因此，在接下来的拼接过程中，不会对FLV进行细致入微的调整，达到基本要求即可。

设置阅读器

阅读器可以使我们很方便地读取文件内容。

class Reader():
  def __init__(self, content): # content (bytes):FLV文件的二进制内容
    self.content = content
    self.start = 0
    self.eof = False # 判断是否已读完全部内容
    self.length = len(self.content)

  def read(self, n=1):
    # 设置 if 语句防止过度读取内容
    if self.length > (self.start + n):
      out = self.content[self.start:self.start + n]
      self.start += n
    else:
      out = self.content[self.start:]
      self.eof = True
    return out

向新建FLV文件写入 Header 和 Tag

在这里假设要拼接的视频基本信息相似，即都含有音视频，分辨率、码率等相同或相近。

为了生成一个可以正常播放的FLV视频，Header 和 Tag 是必不可少的。我们可以选取第一个FLV的文件头写入新建FLV中，然后依次将修改过时间戳的 Tag 写入其中，便可达到拼接目的。

def add_flv(flv, target, videoTimeStamp, audioTimeStamp): # 修改并添加 Tag 的函数
  with open(flv, 'rb') as f:
    content = f.read()
  reader = Reader(content)
  header = reader.read(13)
  with open(target, 'ab') as f:
    while not reader.eof: # 一直读取直到读完，此时 reader.eof = True
      dataType = reader.read(1)
      dataSize = reader.read(3)
      timeStamp = int.from_bytes(reader.read(3), 'big') # 将 3 字节转换成整数
      headerRemained = reader.read(4)
      if dataType == b'\t': # 视频
        timeStamp += videoTimeStamp
        videoTS = timeStamp
      if dataType == b'\x08': # 音频
        timeStamp += audioTimeStamp
        audioTS = timeStamp
      timeStamp = timeStamp.to_bytes(3, 'big') # 将整数转换成 3 字节
      tagHeader = dataType + dataSize + timeStamp + headerRemained
      tagData_andSize = reader.read(int.from_bytes(dataSize, 'big') + 4)
      f.write(tagHeader)
      f.write(tagData_andSize)
  return videoTS, audioTS
def merge_flv(flvs, target): # 主函数
  videoTS = 0
  audioTS = 0
  for i, flv in enumerate(flvs):
    with open(flv, 'rb') as f:
      content = f.read()
    reader = Reader(content)

    header = reader.read(13) # flvHeader + tagSize0
    if i == 0: # 写入第 1 个FLV视频的文件头
      with open(target, 'wb') as f:
        f.write(header)

    videoTS, audioTS = add_flv(flv, target, videoTS, audioTS)

拼接

import time
since = time.time()
flvs = ['m1.flv', 'm2.flv', 'm3.flv', 'm4.flv'] # 视频大小：45MB，20MB，59MB，54MB
target = 't.flv'
merge_flv(flvs, target)
end = time.time()
print('Merging flvs takes {:.2f} s'.format(end - since))
# Merging flvs takes 0.88 s

可以看到，拼接 4 个共 178MB视频用时 0.88 秒。

总结

FLV文件格式还是比较简明的，对数据的要求也是比较宽松的，即便没有对 Scripts 里的参数作调整，拼接后的视频依然能够正常播放。

不过，拼接的视频是有不少隐形问题，如到视频末尾可能会出现音画不同步( 0.5 秒左右)的现象，以及不能够方便地分离出完整的视频和音频。

以上所述是小编给大家介绍的Python实现FLV视频拼接功能，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对我们网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

Python numpy实现二维数组和一维数组拼接的方法

撰写时间:2017.5.23 一维数组 1.numpy初始化一维数组 a = np.array([1,2,3]); print a.shape 输出的值应该为(3,) 二维数组 2.numpy初始化二维数组 a = np.array([[1,2,3]]); b = np.array([[1],[2],[3]]); print a.shape//(1,3) print b.shape//(3,1) 注意(3,)和(3,1)的数组是不一样的,前者是一维数组,后者是二维数组. 拼接 3.numpy有很
python分割和拼接字符串

关于string的split 和 join 方法对导入os模块进行os.path.splie()/os.path.join() 貌似是处理机制不一样,但是功能上一样. 1.string.split(str=' ',num=string.count(str)): 以str为分隔,符切片string,如果num有指定值,则仅分隔num个子字符串.S.split([sep [,maxsplit]]) -> 由字符串分割成的列表返回一组使用分隔符(sep)分割字符串形成的列表.如果指定最大分割数,则在
Python 中字符串拼接的多种方法

python拼接字符串一般有以下几种方法: ①直接通过(+)操作符拼接 s = 'Hello'+' '+'World'+'!' print(s) 输出结果: Hello World! 使用这种方式进行字符串连接的操作效率低下,因为python中使用 + 拼接两个字符串时会生成一个新的字符串,生成新的字符串就需要重新申请内存,当拼接字符串较多时自然会影响效率. ②通过str.join()方法拼接 strlist=['Hello',' ','World','!'] print(''.join(str
Python字符串拼接六种方法介绍

Python字符串拼接的6种方法: 1.加号第一种,有编程经验的人,估计都知道很多语言里面是用加号连接两个字符串,Python里面也是如此直接用"+"来连接两个字符串: print 'Python' + 'Tab' 结果: PythonTab 2.逗号第二种比较特殊,使用逗号连接两个字符串,如果两个字符串用"逗号"隔开,那么这两个字符串将被连接,但是,字符串之间会多出一个空格: print 'Python','Tab' 结果: Python Tab 3.直接连接
python 拼接文件路径的方法

如下所示: <code class="language-python">import os base_dir = os.path.dirname(__file__) # 获取当前文件目录 path = os.path.join(base_dir,'123.txt') # 获取文件拼接后的路径</code> 以上这篇python 拼接文件路径的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
Python实现拼接多张图片的方法

本文实例讲述了Python实现拼接多张图片的方法.分享给大家供大家参考.具体分析如下: 这里所述计划实现如下操作: ① 用Latex写原始博文,生成PDF文档; ② 将PDF转成高清的PNG格式的图片; ③ 将多个PNG格式的图片合并成一大张图片; ④ 将最终的大图片直接上传到博文编辑器中好了,如果将PDF文档转换成其他的图片格式呢?我建议windowns下可用Adobe Acrobat X Pro软件完成这个工作,操作步骤如下面两图所示.注意在图二中一定要自己指定一个分辨率,不用用
解决Python中字符串和数字拼接报错的方法

前言众所周知Python不像JS或者PHP这种弱类型语言里在字符串连接时会自动转换类型,如果直接将字符串和数字拼接会直接报错. 如以下的代码: # coding=utf8 str = '你的分数是:' num = 82 text = str+num+'分 | 琼台博客' print text 执行结果直接报错:TypeError: cannot concatenate 'str' and 'int' objects 解决这个方法只有提前把num转换为字符串类型,可以使用bytes函数把int
python3 拼接字符串的7种方法

Python的3.0版本,常被称为Python 3000,或简称Py3k.相对于Python的早期版本,这是一个较大的升级.为了不带入过多的累赘,Python 3.0在设计的时候没有考虑向下兼容. 1.直接通过(+)操作符拼接 >>> 'Hello' + ' ' + 'World' + '!' 'Hello World!' 使用这种方式进行字符串连接的操作效率低下,因为python中使用 + 拼接两个字符串时会生成一个新的字符串,生成新的字符串就需要重新申请内存,当拼接字符串较多时自然会
Python发送form-data请求及拼接form-data内容的方法

网上关于使用python 的发送multipart/form-data的方法,多半是采用 ulrlib2 的模拟post方法,如下: import urllib2 boundary='-------------------------7df3069603d6' data=[] data.append('--%s' % boundary) data.append('Content-Disposition: form-data; name="app_id"\r\n') data.appen
Python字符串拼接、截取及替换方法总结分析

本文实例讲述了Python字符串拼接.截取及替换方法.分享给大家供大家参考,具体如下: python字符串连接 python字符串连接有几种方法,我开始用的第一个方法效率是最低的,后来看了书以后就用了后面的2种效率高的方法,跟大家分享一下. 先介绍下效率比较低的方法: a = ['a','b','c','d'] content = '' for i in a: content = content + i print content content的结果是:'abcd' 后来我看了书以后,发现书上

Python实现FLV视频拼接功能

相关推荐

随机推荐