无需压缩软件,用python帮你操作压缩包

写在之前

压缩包是互联网上软件发布的标准格式,同时对于系统管理很有用处。当我们需要将多份文件发送给别人的时候,最好通过压缩包的形式发送,还有在备份某些文件的时候,为了减少磁盘空间的占用,也需要对备份的数据进行压缩。

Python 中有一系列对压缩包进行处理的工具,包括创建压缩包,解压压缩包以及获取压缩包中的文件列表等,今天的文章,我们就来学习一下与压缩包相关的 Python 标准库。

管理 zip 压缩包

在大多数情况下,我们在 Windows 下使用 zip 进行压缩,在 Linux 下使用 gzip 或者 bzip2 进行压缩。这一部分,我们来看一下如何管理 zip 格式的压缩包。

1.读取 zip

Python 管理 zip 主要使用 zipfile 模块,这个模块里有一个名为 ZipFile 的对象,我们通过将 zip 压缩包的名称传递给这个对象的函数,这样就打开了一个 zip 压缩包并获得一个 ZipFile 的对象,然后使用这个对象的方法去读取 zip 压缩包里的内容。具体如下所示:

>>> import zipfile
>>> first_zip = zipfile.ZipFile('test.zip')
>>> first_zip.namelist()

namelist() 是 ZipFile 中的常用方法,初次以外还比较常用的方法有 extract,extractall:

  • namelist:返回一个列表,列表中是 zip 中包含的所有文件和文件夹;
  • extract:从 zip 中提取单个文件
  • extarctall:从 zip 文件中提取所有文件

2.创建 zip

与文件的方式类似,如果想要创建一个 zip 格式的压缩文件,必须要以「写」的模式打开 zip 文件,需要说一点的是,ZipFile 的对象是通过 write 方法来添加文件的。具体如下所示:

>>> import zipfile
>>> my_zip = zipfile.ZipFile('test.zip', 'w')
>>> my_zip.write('test.py')
>>> my_zip.close()

上面的代码是创建了一个名为 test.zip 的新 zip 文件,它包含 test.py 压缩后的内容。

管理 tar 包

tar 命令一般是在 Linux 系统中创建压缩包,并且可以指定压缩包的压缩算法。此外 tar 命令也可以创建一个不压缩的 tar 包,仅仅是为了能把多个文件进行打包便于传输。这也就是说,我们在使用 tar 命令的时候,既可以创建普通的 tar 包,也可以创建使用压缩算法压缩过的压缩包。

Python 中使用 tarfile 标准库提供了 tar 命令提供的功能,我们也可以使用它创建一个压缩或者一个非压缩的 tar 包。我之前很多次说过 Python 的简洁优雅体现在方方面面,在这里体现在 tarfile 模块比 Linux 下的 tar 命令用起来更加舒服。

1.读取 tar 包

同样读取 tar 包和 Python 的文件管理操作类似,读写一个压缩包,需要执行打开操作,同时指定打开模式,并且在操作完成以后关闭文件,当然在这里我们可以使用上下文管理器来保证文件的关闭逻辑。具体如下所示:

>>> import tarfile
>>> with tarfile.open('etc.tar') as t:
...  for member in t.getmembers():
...     print(member.name)

上面的代码中,导入 tarfile 库,使用默认的读模式打开 tar 包,tarfile.open() 函数返回一个 TarFile 对象,这个对象表示当前打开的 tar 包,我们可以通过这个对象的方法操作和读取 tar 包中的内容。

tarfile 中有不少函数,其中最常用的有 getnames,extract,extractall 函数:

  • getnames:获取 tar 包中的文件列表;
  • extract:提取单个文件;
  • extractall:提取所有文件。

2.创建 tar 包

从上面的例子中可以看到,读一个 tar 包与读一个文件类似,都是以「读」的方式打开文件并得到一个对象,然后通过这个对象的方法去操作文件。同样创建一个 tar 包和写一个文件也比较类似。具体如下所示:

>>> import tarfile
>>> with tarfile.open('etc.tar', mode='w') as f:
...   f.add('test.py')

上面的代码中,由于我们是创建一个 tar 包,所以以「写」模式打开 tar 包并得到一个 TarFile 对象,然后使用 TarFile 对象的 add 方法将 test.py 文件添加到 tar 包中。

3.tarfile 读取和创建压缩包

上面我们用 targfile 创建和读取未压缩的 tar 包,但是一般情况下,我们创建 tar 包的时候都会使用压缩算法进行压缩,以加快传输速度和减少占用的磁盘空间。

使用 tarfile 创建和读取压缩包非常简单,只要在打开文件时指定压缩算法即可。对于 tarfile 的 open 函数,以「打开模式:压缩算法」的形式打开即可。具体如下所示:

a. 读取一个用 gzip 算法压缩的 tar 包:

>>> import tarfile
>>> with tarfile.open('etc.tar', mode='r:gz') as f:

b. 创建一个用 bzip2 算法压缩的 tar 包:

>>> import tarfile
>>> with tarfile.open('etc.tar', mode='w:bz2') as f:

以上就是无需压缩软件,用python帮你操作压缩包的详细内容,更多关于python 压缩包的资料请关注我们其它相关文章!

(0)

相关推荐

  • 使用python制作一个解压缩软件

    python实现解压缩的重要模块就是--zipfile,其次是os 安装zipfile模块 首先得安装zipfile模块,打开cmd输入一下命令即可安装 pip install zipfile os是python自带的库,所以无需另外安装,直接 import 即可 编写核心代码 压缩文件核心代码: def zip_file(): zip_name = path.get() +'.zip' # 获取绝对路径然后给压缩文件加上.zip结尾 z = zipfile.ZipFile(zip_name,'

  • python3 图片 4通道转成3通道 1通道转成3通道 图片压缩实例

    我就废话不多说了,直接上代码吧! from PIL import Image # 通道转换 def change_image_channels(image, image_path):     # 4通道转3通道 if image.mode == 'RGBA':         r, g, b, a = image.split()         image = Image.merge("RGB", (r, g, b))         image.save(image_path)  

  • Python3实现zip分卷压缩过程解析

    使用zipfile库 查看 官方中文文档 利用 Python 压缩 ZIP 文件,我们第一反应是使用 zipfile 库,然而,它的官方文档中却明确标注"此模块目前不能处理分卷 ZIP 文件",(⊙﹏⊙) 折腾经过 翻遍了Google.CSDN.Stackoverflow等平台均未找到解决方案,最靠谱的是调用外部解压程序实现分卷压缩的功能.但是,如何不依靠外部程序实现这个功能呢?? 于是乎,只能自己慢慢造轮子.看着 ZIP 格式开发商留下的文档 ZIP File Format Spec

  • Python读写压缩文件的方法

    问题 你想读写一个gzip或bz2格式的压缩文件. 解决方案 gzip 和 bz2 模块可以很容易的处理这些文件. 两个模块都为 open() 函数提供了另外的实现来解决这个问题. 比如,为了以文本形式读取压缩文件,可以这样做: # gzip compression import gzip with gzip.open('somefile.gz', 'rt') as f: text = f.read() # bz2 compression import bz2 with bz2.open('so

  • 如何使用Python破解ZIP或RAR压缩文件密码

    这篇文章主要介绍了如何使用Python破解ZIP或RAR压缩文件密码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 我们经常会从网络上下载一些带密码的压缩包,想要获取里面的内容,往往就要给提供商支付一些费用.想要白嫖其中的内容,常见的做法是百度搜索一些压缩包密码破解软件,但后果相信体验过的人都知道.本文将会利用 Python 破解压缩包的密码,这里以 ZIP/RAR 为例. 破解原理 其实原理很简单,一句话概括就是「大力出奇迹」,Python

  • python中将zip压缩包转为gz.tar的方法

    由于同事电脑上没有直接可以压缩gz.tar格式的压缩软件,而工作中这个又时常需要将zip文件转换为gz.tar格式,所以常常将压缩为zip格式的文件发给我来重新压缩成gz.tar格式发给他,能偷懒就不想动手,就用python的tarfile和zipfile包完成了一个将zip转换成gz.tar格式的小脚本: 代码比较简单,也就几行,但是写的时候因为绝对路径的问题浪费了点时间,代码水平还是有待提高. #coding: utf-8 import os import tarfile import zi

  • 详解python解压压缩包的五种方法

    这里讨论使用Python解压例如以下五种压缩文件: .gz .tar  .tgz .zip .rar 简单介绍 gz: 即gzip.通常仅仅能压缩一个文件.与tar结合起来就能够实现先打包,再压缩. tar: linux系统下的打包工具.仅仅打包.不压缩 tgz:即tar.gz.先用tar打包,然后再用gz压缩得到的文件 zip: 不同于gzip.尽管使用相似的算法,能够打包压缩多个文件.只是分别压缩文件.压缩率低于tar. rar:打包压缩文件.最初用于DOS,基于window操作系统. 压缩

  • python3实现的zip格式压缩文件夹操作示例

    本文实例讲述了python3实现的zip格式压缩文件夹操作.分享给大家供大家参考,具体如下: 思路:先把第一级目录中的文件进行遍历,如果是文件,则把它连同当前路径一起加入result(list),如果是子目录,则在整个目录上继续深度优先遍历,直到所有的文件都被加入.主要使用python3中zipfile模块: class zipfile.ZipFile(file [,mode [,compression [,allowZip64 ] ] ] ) 参数说明: 1.第一个参数file可以是文件(字符

  • 无需压缩软件,用python帮你操作压缩包

    写在之前 压缩包是互联网上软件发布的标准格式,同时对于系统管理很有用处.当我们需要将多份文件发送给别人的时候,最好通过压缩包的形式发送,还有在备份某些文件的时候,为了减少磁盘空间的占用,也需要对备份的数据进行压缩. Python 中有一系列对压缩包进行处理的工具,包括创建压缩包,解压压缩包以及获取压缩包中的文件列表等,今天的文章,我们就来学习一下与压缩包相关的 Python 标准库. 管理 zip 压缩包 在大多数情况下,我们在 Windows 下使用 zip 进行压缩,在 Linux 下使用

  • Python使用shutil操作文件、subprocess运行子程序

    一.shutil模块(了解):高级的文件.文件夹.压缩包处理模块. import shutil # shutil.copyfileobj(fsrc, fdst[, length]),将文件内容拷贝到另一个文件中 shutil.copyfileobj(open('old.xml', 'r'), open('new.xml', 'w')) # shutil.copyfile(src, dst),拷贝文件 shutil.copyfile('f1.log', 'f2.log') # 目标文件无需存在 #

  • Python练习之操作SQLite数据库

    目录 前言 1.创建SQLite数据库 2.向SQLite表中插入数据 3.查询SQLite表中的数据 总结 前言 文章包括下几点: 考点--操作SQLite数据库: 创建SQLite数据库: 向表中插入记录: 其他数据库操作. 面试题: 1.面试题一:如何创建SQLite数据库? 2.面试题二:如何向SQLite表中插入数据? 3.面试题三:如何查询SQLite表中的数据? 1.创建SQLite数据库 # coding=utf-8 # _author__ = 孤寒者 import sqlite

  • Python对数据库操作

    Windows下安装MySQL-python 下载地址:https://pypi.python.org/pypi/MySQL-python/1.2.5 安装到系统即可. linux下安装MySQL-python以连接MySQL: 下载地址:https://pypi.python.org/pypi/MySQL-python/ 解压后,进入目录下,执行python setup.py install 安装过程中,常会遇到的问题: 1. 提示找不到mysql_config的话,一般是由于mysql采用的

  • Python set常用操作函数集锦

    定义 set是一个无序且不重复的元素集合. 集合对象是一组无序排列的可哈希的值,集合成员可以做字典中的键.集合支持用in和not in操作符检查成员,由len()内建函数得到集合的基数(大小), 用 for 循环迭代集合的成员.但是因为集合本身是无序的,不可以为集合创建索引或执行切片(slice)操作,也没有键(keys)可用来获取集合中元素的值. set和dict一样,只是没有value,相当于dict的key集合,由于dict的key是不重复的,且key是不可变对象因此set也有如下特性:

  • python简单图片操作:打开\显示\保存图像方法介绍

    一提到数字图像处理,可能大多数人就会想到matlab,但matlab也有自身的缺点: 1.不开源,价格贵 2.软件容量大.一般3G以上,高版本甚至达5G以上. 3.只能做研究,不易转化成软件. 因此,我们这里使用python这个脚本语言来进行数字图像处理. 要使用python,必须先安装python,一般是2.7版本以上,不管是在windows系统,还是linux系统,安装都是非常简单的. 要使用python进行各种开发,就必须安装对应的库.这和matlab非常相似,只是matlab里面叫工具箱

  • Python基于dom操作xml数据的方法示例

    本文实例讲述了Python基于dom操作xml数据的方法.分享给大家供大家参考,具体如下: 1.xml的内容为del.xml,如下 <?xml version="1.0" encoding="utf-8"?> <catalog> <maxid>4</maxid> <login username="pytest" passwd='123456'> <caption>Python

  • python使用Flask操作mysql实现登录功能

    用到的一些知识点:Flask-SQLAlchemy.Flask-Login.Flask-WTF.PyMySQL 这里通过一个完整的登录实例来介绍,程序已经成功运行,在未登录时拦截了success.html页面跳转到登录页面,登录成功后才能访问success. 以下是项目的整体结构图: 首先是配置信息,配置了数据库连接等基本的信息,config.py DEBUG = True SQLALCHEMY_ECHO = False SQLALCHEMY_DATABASE_URI = 'mysql+pymy

  • Python函数参数操作详解

    本文实例讲述了Python函数参数操作.分享给大家供大家参考,具体如下: 简述 在 Python 中,函数的定义非常简单,满足对应的语法格式要求即可.对于调用者来说,只需关注如何传递正确的参数,以及获取相应的返回值就足够了,无需了解函数的内部实现(除非想学习.跟踪源码). 话虽如此,但对于函数的定义来说,灵活性非常高.除了常规定义的必选参数以外,还支持默认参数.可变参数.以及关键字参数.这样以来,不但能处理复杂的参数,还可以简化调用者的代码. 形参和实参 不止 Python,几乎所有的编程语言都

  • Python列表解析操作实例总结

    本文实例讲述了Python列表解析操作.分享给大家供大家参考,具体如下: 列表解析 Python 的强大特性之一是其对 list 的解析,它提供一种紧凑的方法,可以通过对 list 中的每个元素应用一个函数,从而将一个 list 映射为另一个 list. 列表解析,又叫列表推导式( list comprehension) 列表解析比 for 更精简,运行更快,特别是对于较大的数据集合 列表解析可以替代绝大多数需要用到 map和 filter的场合 列表推导式提供了一个创建链表的简单途径,无需使用

随机推荐