Python实现清理重复文件功能的示例代码

目录
  • 前置
  • 查找、删除重复文件
  • GUI制作
    • GUI界面设计
    • 逻辑设计
  • 效果展示

在电脑上或多或少的存在一些重复文件,体积小的倒没什么,如果体积大的就很占内存了,而如果自己一个一个查看文件是否重复,然后再删除,还是很要命的。

为此,我用python制作了一个删除重复文件的小工具,核心代码很简单,就十行代码,不管什么类型的文件都可以一键删除!

前置

PySimpleGUI库用来创建可视化界面,os操作文件,只需要这两个库:

import os
import PySimpleGUI as sg

os为内置库,PySimpleGUI使用pip命令安装即可:

pip install 库名

查找、删除重复文件

查找重复文件分为两步:

第一步是获得需要查找的文件路径;

第二步是各个文件进行对比出重复文件。

这里用os.walk()遍历文件夹下的所有文件,该函数可以得到一个三元元组(root,dirs,files),参数含义如下:

  • root:所指的是当前正在遍历的这个文件夹的本身的地址;
  • dirs:是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录);
  • files:同样是 list , 内容是该文件夹中所有的文件(不包括子目录)。

file_path即walk()函数中的参数top,是你所要遍历的目录的路径,C、D盘或者指定文件夹均可:

 for root, dirs, files in os.walk(file_path):
     for file in files:
      # 组合得到文件夹所有文件的路径
         path = os.path.join(root, file)

得到所有的文件路径后,对其进行读取,不同的文件格式读取出来的内容都是不同的,然后通过字典映射的方式存储读取的内容和路径,接着只需要进行判断是否有重复的内容,有的话根据路径用os.remove()进行删除:

dict = {}
f = open(path, 'rb').read()
if f in dict:
     # 删除
     os.remove(path)
     print('删除重复文件:', path)
 else:
     dict[f] = path

以上就是核心代码,一共十行。

GUI制作

为了以后方便使用,不用一次次跑程序,而在原有的程序基础上进行GUI制作,最后打包成.exe可执行文件。

GUI界面设计

界面我只做了个简单的基础版本,相关内容可以看千图成像,有兴趣的还可以加入“选择需要删除文件格式”的选项,进行选择性删除。

# 主题设置
sg.theme('LightBrown3')  

# 布局设置
layout = [
    [sg.Frame(layout=[
        [sg.InputText(key='file_path', size=(41, 1), font=("微软雅黑", 10), enable_events=True),
         sg.FolderBrowse('选择文件夹',
                       font=("微软雅黑", 12)),
         ],
    ],
        title='文件夹选择', title_color='blue', font=("微软雅黑", 10), relief=sg.RELIEF_SUNKEN, )],
    [sg.Frame(layout=[
        [sg.Output(size=(51, 10), font=("微软雅黑", 10))],
    ],
        title='信息展示', title_color='blue', font=("微软雅黑", 10), relief=sg.RELIEF_SUNKEN, )],

    [sg.Button('开始删除', font=("微软雅黑", 12)),
     sg.Text('', font=("微软雅黑", 12), size=(27, 0)), sg.Button('退出程序', font=("微软雅黑", 12), button_color='red')]
]

# 创建窗口
window = sg.Window('删除重复文件', layout, font=("微软雅黑", 12), default_element_size=(80, 1))

filepath = []

# 事件循环
while True:
    # 退出按钮
    event, values = window.read()
    if event in (None, '退出程序'):
        break
window.close()

界面效果如下:

GUI界面效果

逻辑设计

获取文件夹路径,把得到的路径存入列表中:

 if event == 'file_path':
    files = values['file_path']
    if os.path.exists(files):
        filepath.append(files)
    else:
        print('文件夹不存在,请重新选择!')
        sg.popup('文件夹不存在,请重新选择!')

启动按钮,点击时把路径列表传入main函数中:

if event == '开始删除':
    if len(filepath) != 0:
        main(filepath)
    else:
        sg.popup('文件夹未选择!')

GUI打包

打包可以直接使用pyinstaller进行安装;如果你不知道怎么打包,或者不熟悉命令行操作,可以使用前面文章:打包工具,这款打包工具可以简单的满足打包需求。

使用pyinstaller库打包,启动命令行窗口,在命令行窗口cd到文件所在的文件目录中,最后用下面命令进行打包:

pyinstaller -F -w 名称.py

打包过程没出现什么状况,会得到几个文件,进入dist文件夹,就可以看见.exe文件了。

效果展示

示例结果

至此,我们就成功利用Python实现了清理重复文件工具。

到此这篇关于Python实现清理重复文件功能的示例代码的文章就介绍到这了,更多相关Python清理重复文件内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • python编程实现清理微信重复缓存文件

    目录 glob 模块 glob方法 zlib.crc32 去重复 总结 文 | 某某白米饭 来源:Python 技术「ID: pythonall」 微信和 QQ 都有一个存放缓存文件的文件夹,微信在设置 --> 文件管理,QQ 在系统设置 --> 基本设置 --> 文件管理 --> 打卡个人文件中找到它,平时大家对这个文件夹关注度不高,这个文件夹慢慢的,偷偷的就占用了好几十个 G 的磁盘空间.下面就用 Python 写个删除重复文件的脚本清理这些空间. glob 模块 glob 模

  • python实现自动清理重复文件

    前言 大家好,又到了Python办公自动化系列. 今天分享一个系统层面的自动化案例: 「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除」 主要涉及的知识点有: os模块综合应用 glob模块综合应用 利用filecmp模块比较两个文件 步骤分析 该程序实现的逻辑可以具化为: 遍历获取给定文件夹下的所有文件,然后通过嵌套循环两两比较文件是否相同,如果相同则删除后者. 实现问题的关键就变成了? 如何判断两个文件是否相同? 在这里我们可以使用filecmp模块,来看看官

  • 用Python自动清理电脑内重复文件,只要10行代码(自动脚本)

    给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除 主要涉及的知识点有: os模块综合应用 glob模块综合应用 利用filecmp模块比较两个文件 步骤分析 该程序实现的逻辑可以具化为: 遍历获取给定文件夹下的所有文件,然后通过嵌套循环两两比较文件是否相同,如果相同则删除后者. 实现问题的关键就变成了 如何判断两个文件是否相同? 在这里我们可以使用filecmp模块,来看看官方的介绍文档: filecmp.cmp(f1, f2, shallow=True) 比较名为

  • Python自动化办公之清理重复文件详解

    目录 清理重复的文件 清理重复文件的优化 清理重复的文件 已知条件: 什么都不知道,只需要知道它是文件就可以了 实现方法: 可以从指定路径(或最上层路径)开始读取,利用 glob 读取每个文件夹,读到文件,记录名称和大小,每一次检测之前是否读取过相同名称的文件,如果存在,判断大小是否相同,如果相同,我们就认为这是重复文件,将其删除. 代码示例如下: # coding:utf-8 import glob import os.path data = {} # 定义一个空的字典,暂时将文件名存进来 d

  • Python实现清理重复文件功能的示例代码

    目录 前置 查找.删除重复文件 GUI制作 GUI界面设计 逻辑设计 效果展示 在电脑上或多或少的存在一些重复文件,体积小的倒没什么,如果体积大的就很占内存了,而如果自己一个一个查看文件是否重复,然后再删除,还是很要命的. 为此,我用python制作了一个删除重复文件的小工具,核心代码很简单,就十行代码,不管什么类型的文件都可以一键删除! 前置 PySimpleGUI库用来创建可视化界面,os操作文件,只需要这两个库: import os import PySimpleGUI as sg os为

  • python实现MD5进行文件去重的示例代码

    目录 前言 工作原理 代码 前言 工作中偶尔会遇到文件去重的事情,收到一大堆文件,名称各不相同,分析文件的时候发现有不少重复的文件,导致工作效率低下,那么,这里就写了一个python脚本实现文件去重功能 工作原理 脚本会检查你给出的文件路径下的所有文件,然后计算每个文件的MD5值,并将其加入到一个列表中. 如果某文件的MD5值不在列表中,就认定其是我们需要的文件,脚本会在桌面新建一个名为"去重结果"的文件夹,并将其复制到里面去. 如果某文件的MD5值在列表中,就认定其不是我们需要的文件

  • Python实现淘宝秒杀功能的示例代码

    1.安装 Selenium 模块 Selenium支持很多浏览器,我选择的是Firefox浏览器. 安装方法: ①打开cmd: ②输入命令 pip install selenium: ③回车,等待自动安装: ④当最后一行代码出现Successfully install selenium-XX时,表示安装成功. 2. 插件 FireBug FireBug 是火狐浏览器的一款查看代码元素的插件,可以快速的定位元素,selenium的重点就是元素定位,只有定到位了,才能进行下一步操作. 测试安装成功,

  • Python实现自动回复QQ消息功能的示例代码

    目录 1.需要安装的模块 2.整体逻辑 3.代码实现 最近在看测试相关的内容,发现自动化测试很好玩,就决定做一个自动回复QQ消息的脚本(我很菜) 1.需要安装的模块 这个自动化脚本需要用到3个模块,如果要使用这个脚本的朋友,自己的python中可能没有安装这些模块,所以就可以安装一下 第1个模块:pyautogui 这个模块主要是用来让程序自动控制鼠标和键盘的一系列操作来达到自动化测试的目的. 在cmd下输入安装命令:pip install pyautogui 第2个模块:pyperclip 这

  • Python实现清理微信僵尸粉功能示例【基于itchat模块】

    本文实例讲述了Python实现清理微信僵尸粉功能.分享给大家供大家参考,具体如下: 原理 通过Pyhton调用itchat模块登录网页版微信,给你所有好友发送特殊符号,对方收不到这个特殊符号,只要有人删了你,你的微信就会显示被删的人. 所需环境 Python3 itchat模块 安装 pip install itchat 使用 新建qf.py文件,拷贝下面代码,保存 import itchat import time itchat.auto_login(hotReload=True) # 热加载

  • Python实现删除重复文件的示例代码

    此程序主要是针对某个目录下的全部文件进行筛选,会删除重复的文件. 原理很简单,会计算每个文件的哈希,将哈希存入一个字典,文件名对应哈希. import os import hashlib def hash_file(filename): """Return the SHA-1 hash of the file content.""" h = hashlib.sha1() with open(filename, 'rb') as f: while

  • Python简单读取json文件功能示例

    本文实例讲述了Python简单读取json文件功能.分享给大家供大家参考,具体如下: read_json.json: { "rule":{ "namespace":"strategy", "name":"test_exp_1496234234223400", "version":0, "last_modify_time":1434234236819000, "

随机推荐