Python在后台自动解压各种压缩文件的实现方法

1.需求描述

编写一个 Python 程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点:

  • os 模块综合应用
  • glob 模块综合应用
  • 利用 gzip zipfile rarfile tarfile 模块解压文件

2.步骤分析和前置知识

码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为:

  1. 定时检测某个文件夹(如 download 文件夹)是否存在压缩文件
  2. 如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中 删除压缩文件
  3. 提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

提到压缩文件就要分不同压缩格式进行讨论,主要有以下4种:

.gz: 即 gzip,通常只能压缩一个文件
.tar: 本质上不是压缩工具而是打包工具,可以跟 .gz 配合形成 .tar.gz 的打包压缩格式 .zip: 和 .tar.gz 很类似但可以打包压缩多个文件
.rar: 打包压缩文件,最初用于 DOS

因此,文件是否为压缩文件的判断逻辑可以如下:

  1. 建立一个含压缩包后缀的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
  2. 目标文件夹下的所有文件名运行 filename.split(.)[-1] 获取后缀名
  3. 判断后缀名是否在 compressed_lst 中,如果存在则运行后续的解压代码
  4. 如果是以 gz 结尾的文件,解压后需要再次判断是否是以 .tar 结尾,并进行相应处理

不同压缩文件的解压代码各不相同,在后续代码操作中具体展开。

3.代码实现

首先是获取 download 文件夹下所有文件的文件名

import glob
import os

path = r'C:\xxxx\download'
file_lst = glob.glob(path + '/*')
# 列表推导式
filename_lst = [os.path.basename(i) for i in file_lst]

print(filename_lst)

接下来根据文件的后缀名判断是否需要压缩,先看一下代码框架

for i in filename_lst:
  if '.' in i:
    # 获取后缀名
    suffix = i.split('.')[-1]
    # 逐个将后缀名和各格式的压缩后缀匹配
    if suffix == 'gz':
      pass
      if ...: # 再次判断新产生的文件名是否以 .tar 结尾
        pass
    if suffix == 'tar':
      pass
    if suffix == 'zip':
      pass
    if suffix == 'rar':
      pass

这里有2个注意点:

有些文件没有后缀名,因此可能不存在 .,这时用 filename.split('.')[-1]会报错,因此需要先判断
以.gz 结尾的文件,解压后需要再次判断是否是以 .tar 结尾,然后我们就可以分别将四种压缩文件的解压代码写成函数,符合时候单独调用即可
1、处理.gz 文件

import gzip

def ungz(filename):
  filename = filename[:-3] # gz文件的单文件解压就是去掉 filename 后面的 .gz
  gz_file = gzip.GzipFile(filename)
  with open(filename, "w+") as file:
    file.write(gz_file.read())
    return filename # 这个gzip的函数需要返回值以进一步配合untar函数

前面反复提及的 gz 文件有可能跟 tar 文件配合,因此解压 gz 文件后需要再判断是否有必要解开 tar 文件
这里就可以先把 tar 文件的函数写出来
2、处理.tar文件

import tarfile

def untar(filename):
  tar = tarfile.open(filename)
  names = tar.getnames()
  # tar本身是将文件打包,解除打包会产生很多文件,因此需要建立文件夹存放
  if not os.path.isdir(filename + "_dir"):
    os.mkdir(filename + "_dir")
  for name in names:
    tar.extract(name, filename + "_dir/")
  tar.close()

3、处理.zip文件

import zipfile

def unzip(filename):
  zip_file = zipfile.ZipFile(filename)
  # 类似tar解除打包,建立文件夹存放解压的多个文件
  if not os.path.isdir(filename + "_dir"):
    os.mkdir(filename + "_dir")
  for names in zip_file.namelist():
    zip_file.extract(names, filename + "_dir/")
  zip_file.close()

4、处理.rar文件

import rarfile

def unrar(filename):
  rar = rarfile.RarFile(filename)
  if not os.path.isdir(filename + "_dir"):
    os.mkdir(filename + "_dir")
  os.chdir(filename + "_dir")
  rar.extractall()
  rar.close()

可以看到,四种解压代码略有不同,推荐大家实际演示中自己体会一下差别,解压后配合 os.remove() 就可以删除压缩包,现在看看逻辑框架补上解压函数后的内容:

for filename in filename_lst:
  if '.' in filename:
    suffix = filename.split('.')[-1]
    if suffix == 'gz':
      new_filename = ungz(filename)
      os.remove(filename)
      if new_filename.split('.')[-1] == 'tar':
        untar(new_filename)
        os.remove(new_filename)
    if suffix == 'tar':
      untar(filename)
      os.remove(filename)
    if suffix == 'zip':
      unzip(filename)
      os.remove(filename)
    if suffix == 'rar':
      unrar(filename)
      os.remove(filename)

5、实现实时检测

比较简单的方法就是建立 while True 死循环配合 time.sleep()睡眠,框架如下:

import time

while True:
  func()
  time.sleep(5) # 睡眠秒数可以设置大一点避免过度占用资源

最后将第二步的实现代码改为函数并放在循环框架中就可以完成本次需求,完整代码如下

import glob
import os
import gzip
import tarfile
import zipfile
import rarfile
import time

path = r'C:\xxxx\download'
file_lst = glob.glob(path + '/*')
filename_lst = [os.path.basename(i) for i in file_lst]

def ungz(filename):
  filename = filename[:-3]
  gz_file = gzip.GzipFile(filename)
  with open(filename, "w+") as file:
    file.write(gz_file.read())
  return filename

def untar(filename):
  tar = tarfile.open(filename)
  names = tar.getnames()
  if not os.path.isdir(filename + "_dir"):
    os.mkdir(filename + "_dir")
  for name in names:
    tar.extract(name, filename + "_dir/")
  tar.close()

def unzip(filename):
  zip_file = zipfile.ZipFile(filename)
  if not os.path.isdir(filename + "_dir"):
    os.mkdir(filename + "_dir")
  for names in zip_file.namelist():
    zip_file.extract(names, filename + "_dir/")
  zip_file.close()

def unrar(filename):
  rar = rarfile.RarFile(filename)
  if not os.path.isdir(filename + "_dir"):
    os.mkdir(filename + "_dir")
  os.chdir(filename + "_dir")
  rar.extractall()
  rar.close()

def unzip_files():
  for filename in filename_lst:
    if '.' in filename:
      suffix = filename.split('.')[-1]
      if suffix == 'gz':
        new_filename = ungz(filename)
        os.remove(filename)
        if new_filename.split('.')[-1] == 'tar':
          untar(new_filename)
          os.remove(new_filename)
      if suffix == 'tar':
        untar(filename)
        os.remove(filename)
      if suffix == 'zip':
        unzip(filename)
        os.remove(filename)
      if suffix == 'rar':
        unrar(filename)
        os.remove(filename)

while True:
  unzip_files()
  time.sleep(5)

到此这篇关于Python在后台自动解压各种压缩文件的实现方法的文章就介绍到这了,更多相关Python自动解压各种压缩文件内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python脚本破解压缩文件口令实例教程(zipfile)

    zipfile模块是python中一个处理压缩文件的模块,解决了不少我们平常需要处理压缩文件的需求 ,本文主要谈谈zipfile几个常用的用法. 环境:Windows python版本2.7.15 Python中操作zip压缩文件的模块是 zipfile . 相关文章:Python中zipfile压缩文件模块的使用 我们破解压缩文件的口令也是用的暴力破解方法.我们提前准备好密码字典用来爆破,如果密码字典中存在密码,则会打印出该密码,否则提示密码字典中无密码. main()函数用来打开密码字典 k

  • 详解Python 解压缩文件

    zipfile模块及相关方法介绍: 1 压缩 1.1 创建zipfile对象 zipfile.ZipFile(file, mode='r', compression=0, allowZip64=True, compresslevel=None) 创建Zipfile对象,主要参数: 1>file压缩包名称: 2>mode:读'r'或者写'w'模式: 3>compression:设置压缩格式: 4>compresslevel:压缩等级: 压缩格式分类: 1.2 添加压缩文件 zipob

  • python 批量解压压缩文件的实例代码

    下面给大家介绍python 批量解压压缩文件的实例代码,代码如下所述: #/usr/bin/python#coding=utf-8import os,sys import zipfile open_path='e:\\data'save_path='e:\\data' os.chdir(open_path) #转到路径 #首先,通过zipfile模块打开指定位置zip文件 #传入文件名列表,及列表文件所在路径,及存储路径def Decompression(files,file_path,save

  • 使用Python读写及压缩和解压缩文件的示例

    读写文件 首先看一个例子: f = open('thefile.txt','w') #以写方式打开, try: f.write('wokao') finally: f.close() 文件的打开方式: f = open('文件','mode') 'r':只读(缺省.如果文件不存在,则抛出错误) 'w':只写(如果文件不存在,则自动创建文件),此时无法调用f.read()方法,且当调用f.write()时,将清空文件原有内容 'a':附加到文件末尾 'r+':读写 如果需要以二进制方式打开文件,需

  • Python实现压缩文件夹与解压缩zip文件的方法

    本文实例讲述了Python实现压缩文件夹与解压缩zip文件的方法.分享给大家供大家参考,具体如下: 直接上代码 #coding=utf-8 #甄码农python代码 #使用zipfile做目录压缩,解压缩功能 import os,os.path import zipfile def zip_dir(dirname,zipfilename): filelist = [] if os.path.isfile(dirname): filelist.append(dirname) else : for

  • Python在后台自动解压各种压缩文件的实现方法

    1.需求描述 编写一个 Python 程序,每次下载压缩包形式的文件后,自动将内部文件解压到当前文件夹后将压缩包删除,通过本案例可以学到的知识点: os 模块综合应用 glob 模块综合应用 利用 gzip zipfile rarfile tarfile 模块解压文件 2.步骤分析和前置知识 码代码之前需要将复杂问题解释成多个明确的要求,即这个程序实现的逻辑为: 定时检测某个文件夹(如 download 文件夹)是否存在压缩文件 如果有新出现的压缩文件则将其解压到当前文件夹内的新文件夹中 删除压

  • java 解压与压缩文件夹的实例详解

     java 解压与压缩文件夹的实例详解 注意:JDK7支持设置编码设置编码格式 zipFile,zipInputStream,zipOutputStream都增加了编码格式,如果是jdk1.6需要其他的包辅助 下面为自带jdk压缩文件夹代码: public void dozip(String srcfile, String zipfile) throws IOException { String temp = ""; File src = new File(srcfile); File

  • Java解压和压缩带密码的zip文件过程详解

    前言 JDK自带的ZIP操作接口(java.util.zip包,请参看文章末尾的博客链接)并不支持密码,甚至也不支持中文文件名. 为了解决ZIP压缩文件的密码问题,在网上搜索良久,终于找到了winzipaes开源项目. 该项目在google code下托管 ,仅支持AES压缩和解压zip文件( This library only supports Win-Zip's 256-Bit AES mode.).网站上下载的文件是源代码,最新版本为winzipaes_src_20120416.zip,本

  • 利用R语言解压与压缩.tar.gz.zip等格式文件

    目录 .zip .tar.gz .gz 与 .bz2 1) 直接解压 2) 直接读取 参考 最近尝试用 R 对一些文件进行批量的解压与压缩,这里记录一些常用的解压与压缩的方法. 由于解压与压缩是对称的两种方法,这里我们着重以对文件的解压为例,分不同的格式进行讲解. .zip 压缩:zip() 解压:unzip() 若要压缩文件,就直接在 zip() 函数的第一个参数里面输入压缩后的文件名,第二个参数输入压缩前的文件名. 而解压文件就更简单了,直接利用 unzip() 里面加上需要解压的文件名称即

  • Python实现压缩与解压gzip大文件的方法

    本文实例讲述了Python实现压缩与解压gzip大文件的方法.分享给大家供大家参考,具体如下: #encoding=utf-8 #author: walker #date: 2015-10-26 #summary: 测试gzip压缩/解压文件 import gzip BufSize = 1024*8 def gZipFile(src, dst): fin = open(src, 'rb') fout = gzip.open(dst, 'wb') in2out(fin, fout) def gun

  • python用模块zlib压缩与解压字符串和文件的方法

    python中zlib模块是用来压缩或者解压缩数据,以便保存和传输.它是其他压缩工具的基础.下面来一起看看python用模块zlib压缩与解压字符串和文件的方法.话不多说,直接来看示例代码. 例子1:压缩与解压字符串 import zlib message = 'abcd1234' compressed = zlib.compress(message) decompressed = zlib.decompress(compressed) print 'original:', repr(messa

  • 文件上传服务器-jupyter 中python解压及压缩方式

    由于并不清楚服务器具体地址,只有jupyter 连接的情况下,上传文件. 方法一:用Linux命令 直接用linux命令,在jupyter中只需要在命令前加一个!即可.学校服务器上没有装zip,但装了tar,可以在压缩的时候选择文件压缩为.tar.gz的文件格式. 命令: !tar -zxvf ./Language-Detector.tar.gz 方法二: 用python的函数模块. ### 利用zipfile模块来压缩和解压文件 <br> 先将想要上传的多个文件压缩为.zip格式,在jupy

  • python解决Fedora解压zip时中文乱码的方法

    前言 很多时候在windows下压缩文件没问题,但是到了Linux下,出现乱码,很常见.以前在Ubuntu下,用`unzip -O GBK filename.zip` 就可以搞定. 换了Fedora后,暂时没发现乱码的压缩文件.晚上下载一本书的光盘,又碰到了乱码.尝试之前的方法没成功.看了下unzip的help,没-O那个参数了== 刚好找到一个用python解决的办法,分享下. 新建一个`.py`后缀的文件,直接复制粘贴代码: #!/usr/bin/env python # -*- codin

  • java实现文件夹解压和压缩

    本文实例为大家分享了java实现文件夹解压和压缩的具体代码,供大家参考,具体内容如下 效果 实现多个文件以及文件夹的压缩和解压 代码分析 import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.util.zip.ZipEntry

  • python解压zip包中文乱码解决方法

    乱码得原因: 由于ZipFile模块导出遇到中文解码不对,windows上会出现,linux是否会出现不知道没测试过. 解决方式: 1. 搞个文件名引射表(不太方便,少量文件夹套用时候还可以) 2. 修改源码解码格式(不太方便,自己搞了一下,之后报其他错误) 3. 自己写入文件,自己创建文件夹(推荐) 自己创建的写法: with zipfile.ZipFile(file=zip_save_path, mode='r') as zf: # 解压到指定目录,首先创建一个解压目录 os.mkdir(u

随机推荐