Python实现视频下载与合成的示例代码

目录
  • 模块使用
  • 开发环境
  • 案例实现
    • 1.明确需求
    • 2.代码实现步骤
  • 实现代码

模块使用

requests >>> pip install requests (数据请求 第三方模块)

re # 正则表达式 去匹配提取数据

json

开发环境

Python 3.8 解释器

Pycharm 2021.2 版本 建议

win + R 输入cmd 输入安装命令 pip install 模块名 如果出现爆红 可能是因为 网络连接超时 切换国内镜像源

案例实现

1.明确需求

采集内容, 先分析一个视频是从哪里获取

通过开发者工具进行抓包分析, 分析视频数据可以从哪里获取内容 格式 m3u8视频内容

当我们网站视频格式 是m3u8的时候, 有一个专门存放所有ts视频片段的文件

2.代码实现步骤

  • 发送请求
  • 获取数据
  • 解析数据
  • 保存数据

1. 发送请求, 对于视频播放页面url地址发送请求

2. 获取数据, 获取服务器返回response响应数据

3. 解析数据, 提取我们想要的数据内容 视频标题 以及 m3u8 链接

4. 发送请求, 对于 m3u8 链接 发送请求

5. 获取数据, 获取服务器返回response响应数据

6. 解析数据, 提取所有ts文件url [视频片段]

7. 保存数据, 把所有视频保存下来, 然后合成为一个整体视频内容

实现代码

import requests  # 数据请求模块 pip install requests  在cmd里面 输入命令
import re  # 导入正则表达式模块 内置模块
import json
import pprint  # 格式化输出模块

for page in range(1, 17):
    print(f'--------------------正在采集第{page}页的数据内容--------------------')
    list_url = 'https://www.acfun.cn/u/45321802'
    # 批量 ctrl + R 选中目标
    data = {
        'quickViewId': 'ac-space-video-list',
        'reqID': page + 1,
        'ajaxpipe': '1',
        'type': 'video',
        'order': 'newest',
        'page': page,
        'pageSize': '20',
        't': '1649944573765',
    }
    headers = {
        # 'cookies': '你的cookie',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36'
    }
    # get请求 有一个params参数
    # post请求 data 参数
    response = requests.get(url=list_url, params=data, headers=headers)
    # print(response.text)
    id_list = re.findall('a href=.*?ac(.*?)"', response.text)
    for index in id_list:
        video_id = index.replace('\\', '')
        """
        1. 发送请求, 对于视频播放页面url地址发送请求
            用python代码去模拟浏览器 对于 url地址发送请求
        video
        """
        url = f'https://www.acfun.cn/v/ac{video_id}'  # 确定请求url地址
        # 请求头 用伪装python代码, 为了被服务器识别出来 是爬虫程序 一种简单反反爬手段 当你加ua 得到数据的时候, 可能要cookie
        # 需要登陆才能获得数据的, 需要加cookie 用户信息, 常用于检测是否登陆账号
        headers = {
            # 'cookies': '你的cookie',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.75 Safari/537.36'
        }
        # 通过requests模块里面get请求方式, 对于url地址发送请求, 并且携带上headers请求头伪装, 最后用response自定义变量接收返回数据
        response = requests.get(url=url, headers=headers)
        # 2. 获取数据
        # print(response.text)
        # 3. 解析数据 通过re模块里面findall的方法 在response.text里面去找寻 标题数据 re.S 匹配换行
        # 正则表达式提取出来的数据返回都是列表数据类型  实现过程不重要, 方式方法很多, 你喜欢用哪个都可以 只要可以取到数据都OK
        title = re.findall('<title >(.*?) - AcFun弹幕视频网 - 认真你就输啦 \(\?ω\?\)ノ- \( ゜- ゜\)つロ</title>', response.text)[0]
        video_info = re.findall('window.pageInfo = window.videoInfo = (.*?);', response.text)[0]

        # print(video_info) # 字符串转成字典 怎么转  最稳妥查看数据类型 直接用 type() 这个函数去查看
        json_data = json.loads(video_info)
        # pprint.pprint(json_data)
        # 字典取值 根据冒号左边的内容(键) 提取冒号右边的内容(值)
        m3u8_url = \
        json.loads(json_data['currentVideoInfo']['ksPlayJson'])['adaptationSet'][0]['representation'][0]['backupUrl'][0]
        # print(title)
        # print(m3u8_url)
        # 通过requests模块里面get请求方式, 对于m3u8_url地址发送请求, 并且携带上headers请求头伪装, 获取响应体文本数据, 用m3u8_data自定义变量接收数据
        m3u8_data = requests.get(url=m3u8_url, headers=headers).text
        # split() 字符串分割
        m3u8_data = re.sub('#E.*', '', m3u8_data).split()
        # print(m3u8_data)
        for ts in m3u8_data:
            ts_url = 'https://ali-safety-video.acfun.cn/mediacloud/acfun/acfun_video/' + ts
            ts_content = requests.get(url=ts_url, headers=headers).content
            # ab 是什么意思 a追加保存, b 二进制数据 ab 以二进制数据追加保存
            with open('video\\' + title + '.mp4', mode='ab') as f:
                f.write(ts_content)
        print('视频保存完成: ', title)

视频教程

到此这篇关于Python实现视频下载与合成的示例代码的文章就介绍到这了,更多相关Python视频下载 合成内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python爬虫实战之批量下载快手平台视频数据

    知识点 requests json re pprint 开发环境: 版 本:anaconda5.2.0(python3.6.5) 编辑器:pycharm 案例实现步骤: 一. 数据来源分析 (只有当你找到数据来源的时候, 才能通过代码实现) 1.确定需求 (要爬取的内容是什么?) 爬取某个关键词对应的视频 保存mp4 2.通过开发者工具进行抓包分析 分析数据从哪里来的(找出真正的数据来源)? 静态加载页面 笔趣阁为例 动态加载页面 开发者工具抓数据包 [付费VIP完整版]只要看了就能学会的教程,

  • Python实现一键下载视频脚本

    目录 需求 解决方案 代码 总结 需求 小编通常会上一些专业的视频网站比如腾讯视频.优酷,在上面看电影.电视剧.这些网站有个优点,可以缓存视频,在通勤路上比如地铁就可以愉快的刷剧了,因为地铁上的网速通常不怎么好. 但是有一些经典电影或者电视剧,这些视频并没有提供,那么我们只能上一些小电影网站看了,资源是有了,但是问题来了,这些小电影网站大多数都没有视频下载功能,那在地铁上就没法看了. 如果可以把这些视频下载下来,再传输到手机里不就可以离线看了吗? 接下来小编就演示下如何用 python 脚本来实

  • python实现bilibili动画下载视频批量改名功能

    bilib应用 在微软商店中下载哔哩哔哩动画,虽然软件UI古老,但是贵在稳定和支持下载 安装以后搜索自己想要的视频,然后缓存下载 下载后进入下载的路径 视频文件重命名 打开自动命令的程序或者py脚本,选择视频合集下载的路径 选择是否自动添加序号 最后在下载目录的video下面可以找到整合好的视频 打包成exe程序 pyinstaller -F -w -i rename.ico rename.py python脚本 import os import sys import json import s

  • 基于Python制作B站视频下载小工具

    目录 1. 原理简介 2. 网页分析 3. 视频爬取 4. 存入本地 5. GUI工具制作 1. 原理简介 原理很简单,就是获取视频资源的源地址,然后爬取视频的二进制内容,再写入到本地即可. 2. 网页分析 打开该网页,然后F12进入开发者模式,接着点开网络—>全部,因为视频资源一般比较大,我这里根据大小进行了从大到小的排序,找到了第一条这些可能和视频源地址有关. 然后,我们复制找到的这条里的url部分不变的部分,回到元素中ctrl+F搜索,找到了可能和视频源地址有关的节点. 果然,我们复制这部

  • 用Python下载抖音无水印视频的方法

    分享学习Python爬虫.数据分析.数据挖掘的点滴. 最近发现了抖音无水印视频的下载方法. # 抖音接口 「url」参数值就是从抖音上复制的链接. Python下载 首先来看一下,直接访问抖音链接得到的结果. 妥妥的水印... 接下来打开浏览器的开发者工具,看看视频的地址. 可以发现「playAddr」就是视频的地址,复制然后访问. 链接会重定向到以「v9」开头的链接,然而还是有水印. 接下来就是重点了,首先你需要让你的浏览器能够修改UA,即爬虫经常用到的「User-Agent」. 我用的是Ma

  • Python下载手机小视频的操作方法

    目录 启动 mitmproxy 手机网络配置 下载页 编写下载脚本 今天为大家介绍使用 mitmproxy 这个抓包工具如何监控手机上网,并且通过抓包,把我们想要的数据下载下来. 启动 mitmproxy 首先我们通过执行命令 mitmweb 启动mitmproxy,让它处理监听状态,服务会监听本机 8080 端口,启动后如下: $ mitmweb Web server listening at http://127.0.0.1:8081/ Proxy server listening at h

  • Python实现视频下载与合成的示例代码

    目录 模块使用 开发环境 案例实现 1.明确需求 2.代码实现步骤 实现代码 模块使用 requests >>> pip install requests (数据请求 第三方模块) re # 正则表达式 去匹配提取数据 json 开发环境 Python 3.8 解释器 Pycharm 2021.2 版本 建议 win + R 输入cmd 输入安装命令 pip install 模块名 如果出现爆红 可能是因为 网络连接超时 切换国内镜像源 案例实现 1.明确需求 采集内容, 先分析一个视频

  • Python实现视频自动打码的示例代码

    目录 序言 准备工作 实现原理 模块 素材工具 代码解析 完整代码 序言 我们在观看视频的时候,有时候会出现一些奇怪的马赛克,影响我们的观影体验,那么这些马赛克是如何精确的加上去的呢? 本次我们就来用Python实现对视频自动打码! 准备工作 环境咱们还是使用 Python3.8 和 pycharm2021 即可 实现原理 将视频分为音频和画面: 画面中出现人脸和目标比对,相应人脸进行打码: 处理后的视频添加声音: 模块 手动安装一下 cv2 模块 ,pip install opencv-pyt

  • Python实现视频下载功能

    最近一两年短视频业务风生水起,各个视频网站都有各自特色的短视频内容.如果有这样一个程序,可以把各大视频网站的热门用户最新发布的视频都下载下来,不仅方便自己观看,还可以将没有版权的视频发布在个人社交网站上,增加自己的人气,岂不美哉? parker就是这样一个项目(项目地址:https://github.com/LiuRoy/parker),它采用celery框架定时爬取用户视频列表,将最新发布的视频通过you-get异步下载,可以很方便地实现分布式部署.因为各个网站的页面布局和接口更新比较频繁,为

  • 三行代码使用Python将视频转Gif的方法示例

    目录 一.前言 二.教程 1. 安装必备库moviepy 2. 写入代码 3. 转换效果 4. GIF很大的解决方案 5. 截取视频长度转换 5. 指定转换后的图片大小(分辨率) 一.前言 很多网站提供视频转GIF的功能,但要么收费要么有广告 实际上我们通过python,几行代码就能够实现视频转gif 二.教程 1. 安装必备库moviepy pip install moviepy -i https://pypi.tuna.tsinghua.edu.cn/simple 2. 写入代码 from

  • Python实现图像去雾效果的示例代码

    目录 修改部分 训练测试 数据集 下载地址 修改部分 我利用该代码进行了去雾任务,并对原始代码进行了增删,去掉了人脸提取并对提取人脸美化的部分,如下图 增改了一些数据处理代码,Create_Bigfile2.py和Load_Bigfilev2为特定任务需要加的代码,这里数据处理用的是原始方法,即将训练数据打包成一个文件,一次性载入,可能会内存爆炸.去雾的如下 另外,为了节省内存,可以不使用原始方法,我改写了online_dataset_for_odl_photos.py文件 用于我的加雾论文,此

  • 基于Python制作天眼查小程序的示例代码

    目录 界面搭建 整体布局 界面美化 天眼查爬虫 获取信息 代码编写 结果展示 今天我们一起来制作一个天眼查GUI程序,开宗明义,我们先来看下最终的效果 这次的GUI程序,我们使用的框架是PyQt5,该框架拥有比tkinter更为丰富的内置组件,在界面美化方面,貌似也更胜一筹! 从上图也可以看出,我们的目标还是蛮远大的,最终我们希望可以完成一个工具集合,把我们日常当中常用的功能都集成的该GUI程序中,比如天眼查公司信息,知乎用户知识图谱,B视频弹幕抓取等等. 好了,今天我们先完成天眼查的功能吧~

  • python修改微信和支付宝步数的示例代码

    项目意义 如果你想在支付宝蚂蚁森林收集很多能量种树,为环境绿化出一份力量,又或者是想每天称霸微信运动排行榜装逼,却不想出门走路,那么该python脚本可以帮你实现. 实现方法 手机安装第三方软件乐心健康,注册账号登录,将运动数据同步到微信和支付宝.用python脚本远程修改乐心健康当前登录账号的步数即可. 第一步:在手机上安装乐心健康app. 安卓版下载地址:乐心健康安卓版 苹果版下载地址:乐心健康iOS版 乐心运动app for android v3.0 安卓版 第二步:注册账号登录,并设置登

  • Python实现淘宝秒杀功能的示例代码

    1.安装 Selenium 模块 Selenium支持很多浏览器,我选择的是Firefox浏览器. 安装方法: ①打开cmd: ②输入命令 pip install selenium: ③回车,等待自动安装: ④当最后一行代码出现Successfully install selenium-XX时,表示安装成功. 2. 插件 FireBug FireBug 是火狐浏览器的一款查看代码元素的插件,可以快速的定位元素,selenium的重点就是元素定位,只有定到位了,才能进行下一步操作. 测试安装成功,

  • python 模拟在天空中放风筝的示例代码

    1 前言 昨天是农历的三月初三,相传这一天是轩辕黄帝的诞辰日.春秋时期,三月初三的纪念活动还是非常隆重的,至魏晋则演变为达官显贵.文人雅士临水宴饮的节日.兰亭序中提到的"曲水流觞",也许就是这一习俗的写照吧(个人猜想,未经考证).唐以后,三月初三渐渐湮没于历史的长河中. 于我而言,三月初三却是一个放风筝的日子.每逢这一天,耳边总会响起一首老歌:又是一年三月三,风筝飞满天--上班路上,看道路两侧草长莺飞.杨柳拂面,一时玩心顿起:何不用3D构造一个天上白云飘飘,地上绿草茵茵的虚幻空间,在里

  • Python PyQt5模块实现一个浏览器的示例代码

    目录 1. 首先是环境的安装 (本人使用的是PyCharm,python3.6) 2. 实现代码 3. 运行结果 4. Tips 1. 首先是环境的安装 (本人使用的是PyCharm,python3.6) pip3 install PyQt5 (没有指定版本的话,默认会安装最新的) pip3 install sip pip3 install PyQtWebEngine (PyQtWebEngine是Qt WebEngine的一组框架,该框架提供了在应用程序中嵌入 Web 内容的能力,并且基于 C

随机推荐