Python实现自动化整理文件的示例代码

目录
  • 自动化整理计算机文件
    • 1. 文件的自动分类
    • 2. 文件和文件夹的快速查找
    • 3. 自动清理重复文件
    • 4. 批量转换图片格式
    • 5. 按拍摄日期自动分类图片

自动化整理计算机文件

通过Python编程完成文件的自动分类、文件和文件夹的快速查找、重复文件的清理、图片格式的转换等常见工作。

1. 文件的自动分类

根据文件的扩展名将文件分类整理到不同文件夹中。

使用os和shutil模块

os模块提供了许多操作文件和文件夹的函数,可对文件或文件夹进行新建、删除、查看属性以及查找路径等操作。

shutil模块提供的函数可对文件或文件夹进行移动、复制、压缩等操作。

"""
os模块提供了许多操作文件和文件夹的函数,可对文件或文件夹进行新建、删除、查看属性以及查找路径等操作。
shutil模块提供的函数可对文件或文件夹进行移动、复制、压缩等操作。
"""
import os
import shutil

# 源文件目录
src_dir = "待分类文件/"
# 输出文件的目录
output_dir = '已分类文件/'
files = os.listdir(src_dir)  # 列出src_dir目录下的所有文件及子文件夹的名称
print(files)
for f in files:
    # 获得路径
    src_path = src_dir + f
    # 判断是否是文件
    if os.path.isfile(src_path):
        # 获取文件后缀,与输出目录拼接成输出文件夹路径
        output_path = output_dir + f.split('.')[-1]
        # 判断输出文件夹是否存在,若不存在则需要创建
        if not os.path.exists(output_path):
            os.mkdir(output_path)
        # 将文件移动到输出目录中与其扩展名对应的文件夹中
        shutil.move(src_path, output_path)

测试文件:

效果:

使用pathlib模块

from pathlib import Path

# 源文件目录
src_dir_name = "待分类文件/"
# 输出文件的目录
output_dir_name = '已分类文件/'

# 使用Path()函数为源文件夹和目标文件夹创建路径对象
src_dir = Path(src_dir_name)
output_dir = Path(output_dir_name)

# 在源文件夹下查找文件和子文件夹,*表示返回所有文件和子文件夹(完整路径)
files = src_dir.glob('*')
for f in files:
    # 判断路径是否代表文件
    if f.is_file():
        # 获得输出文件夹路径
        output_path = output_dir / f.suffix.strip('.')
        # 判断输出文件夹是否存在
        if not output_path.exists():
            # 不存在则创建,parents为True表示创建多级文件夹
            output_path.mkdir(parents=True)
        # 将文件路径重命名为给定的路径,实现文件移动
        f.replace(output_path / f.name)

2. 文件和文件夹的快速查找

使用python编写快速查找文件和文件夹程序,实现精确查找和模糊查找。

精确查找文件和文件夹

from pathlib import Path

while True:
    folder = input("请输入查找目录的路径(如:D:\\):")
    folder = Path(folder.strip())  # 使用Path()函数创建路径对象
    # 判断输入的路径是否存在,且是否为目录
    if folder.exists() and folder.is_dir():
        break
    else:
        print("输入的路径有误,请重新输入!")
search_word = input("请输入要查找的文件或文件夹名称:").strip()  # 获得输入的文件或文件夹名称,去掉首尾空格
"""
glob()函数和rglob()函数的区别:
glob()函数和rglob()函数都能使用通配符在指定路径下查找文件和子文件夹。
区别在于:
    glob()函数只进行以及查找,而rglob()函数会进行多级查找。
"""
# 使用rglob()函数在用户输入的路径下查找名称与指定关键词完全相同的文件及字文件夹,并将结果转换成列表
results = list(folder.rglob(pattern=search_word))
if len(results) != 0:
    print(f'在【{folder}】下查找到的结果如下:')
    for r in results:
        print(r)
else:
    print(f'在【{folder}】下未找到名为【{search_word}】的文件或文件夹!')

效果:

模糊查找文件和文件夹

# author:mlnt
# createdate:2022/8/23
from pathlib import Path

while True:
    folder = input("请输入查找目录的路径(如:D:\\):")
    folder = Path(folder.strip())  # 使用Path()函数创建路径对象
    # 判断输入的路径是否存在,且是否为目录
    if folder.exists() and folder.is_dir():
        break
    else:
        print("输入的路径有误,请重新输入!")
search_word = input("请输入要查找的文件或文件夹名称:").strip()  # 获得输入的文件或文件夹名称,去掉首尾空格
"""
glob()函数和rglob()函数的区别:
glob()函数和rglob()函数都能使用通配符在指定路径下查找文件和子文件夹。
区别在于:
    glob()函数只进行以及查找,而rglob()函数会进行多级查找。
"""
# 使用rglob()函数在用户输入的路径下查找名称与指定关键词完全相同的文件及字文件夹,并将结果转换成列表
results = list(folder.rglob(pattern=f'*{search_word}*'))
if len(results) == 0:
    print(f'在【{folder}】下未找到名称包含【{search_word}】的文件或文件夹!')
else:
    result_folders = []  # 查找到的与关键词相关的文件夹
    result_files = []   # 与关键词相关的文件
    for r in results:
        if r.is_dir():
            # 如果是目录(文件夹),则添加到文件夹列表
            result_folders.append(r)
        else:
            result_files.append(r)
    if len(result_folders) != 0:
        print(f'在【{folder}】下查找到的与关键词{search_word}相关的文件夹:')
        for f in result_folders:
            print(f)
    if len(result_files) != 0:
        print(f'在【{folder}】下查找到的与关键词{search_word}相关的文件如下:')
        for f in result_files:
            print(f)

效果:

3. 自动清理重复文件

自动清理文件实现步骤:

1.列出指定文件夹下的所有文件;

2.两两比较文件内容是否相同;

3.如果内容相同,则将其中一个文件移动到指定的文件夹中

"""
自动清理文件实现步骤:
1.列出指定文件夹下的所有文件;
2.两两比较文件内容是否相同;
3.如果内容相同,则将其中一个文件移动到指定的文件夹中
"""

# 导入pathlib模块中的Path()函数
from pathlib import Path
# 导入filecmp模块中的cmp()函数,用于进行文件的比较
from filecmp import cmp

input_dir = '待处理文件'
output_dir = '重复文件'
# 创建Path对象
src_folder = Path(input_dir)
output_folder = Path(output_dir)
# 判断输出目录是否存在
if not output_folder.exists():
    # 不存在则创建目录(多级创建)
    output_folder.mkdir(parents=True)

results = list(src_folder.glob('*'))  # 列出给定目录下的文件及子文件夹
file_list = []
for r in results:
    # 判断路径是否指向一个文件
    if r.is_file():
        # 是则添加到文件列表
        file_list.append(r)

# 遍历文件列表,并进行比较
for i in file_list:
    for j in file_list:
        if i != j and i.exists() and j.exists():
            # 比较两个文件是否相同
            if cmp(i, j):
                # 如果两个文件相同,则把其中一个文件移动到指定文件夹
                # 删除重复文件j.unlink()
                j.replace(output_folder / j.name)

测试文件:

效果:

4. 批量转换图片格式

from pathlib import Path
from PIL import Image

input_dir = 'input_images'
output_dir = 'output_images'
# 创建Path对象
src_folder = Path(input_dir)
output_folder = Path(output_dir)
# 判断输出目录是否存在
if not output_folder.exists():
    # 不存在则创建目录(多级创建)
    output_folder.mkdir(parents=True)

file_list = list(src_folder.glob('*[.jpg|.jpeg]'))  # 查找后缀为jpg或jpeg的图片
for f in file_list:
    output_file = output_folder / f.name
    # 将路径的扩展名进行替换
    output_file = output_file.with_suffix('.png')
    # 保存图片到指定路径
    Image.open(f).save(output_file)
    print(f'{f.name}-->格式转换完成!')

测试文件:

效果:

5. 按拍摄日期自动分类图片

需安装exifread模块:

pip install exifread

步骤:

1.列出指定文件夹下的所有图片;

2.读取图片的EXIF(Exchangeable Image File Format)信息,并提取出拍摄日期;

3.将拍摄日期转换为所需格式,然后使用拍摄日期创建文件夹;

4.将图片移动到拍摄日期对应的文件夹中。

"""
步骤:
    1.列出指定文件夹下的所有图片;
    2.读取图片的EXIF(Exchangeable Image File Format)信息,并提取出拍摄日期;pip install exifread
    3.将拍摄日期转换为所需格式,然后使用拍摄日期创建文件夹;
    4.将图片移动到拍摄日期对应的文件夹中。
"""
from pathlib import Path
from datetime import datetime
from exifread import process_file

input_dir = 'input_images'
output_dir = 'output_dir'
# 创建Path对象
src_folder = Path(input_dir)
output_folder = Path(output_dir)
# 判断输出目录是否存在
if not output_folder.exists():
    # 不存在则创建目录(多级创建)
    output_folder.mkdir(parents=True)

# 查找后缀为jpg或jpeg的图片
file_list = list(src_folder.glob('*[.jpg|.jpeg]'))
for f in file_list:
    with open(f, 'rb') as fp:
        # 读取图片的EXIF信息
        # process_file函数会将读取的EXIF信息以字典格式返回
        tags = process_file(fp, details=False)
    # 判断字典中是否有拍摄日期
    if 'EXIF DateTimeOriginal' in tags.keys():
        dto = str(tags['EXIF DateTimeOriginal'])
        # 将拍摄日期转换成所需格式,作为文件夹名称
        folder_name = datetime.strptime(dto, '%Y:%m:%d %H:%M:%S').strftime('%Y-%m-%d')
        # 设置输出目录的路径
        output_path = output_folder / folder_name
        if not output_path.exists():
            output_path.mkdir(parents=True)
        # 将图片移动到拍摄日期对应的文件夹中
        f.replace(output_path / f.name)

测试文件:

效果:

以上就是Python实现自动化整理文件的示例代码的详细内容,更多关于Python整理文件的资料请关注我们其它相关文章!

(0)

相关推荐

  • Python实现自动整理文件的示例代码

    目录 一.前言 二.遍历文件 三.移动文件 四.自动整理文件 1.将图片集中存放 2.同步整理文件 3.获取文件属性 一.前言 今天我们就带大家来实现一下文件自动整理的操作.在我们日常生活中,文件总是杂乱无章的,这个时候就需要我们整理一下.但是文件太多的话整理起来是非常麻烦的,因此我们今天就来用Python实现文件的自动整理. 二.遍历文件 要整理文件,我们首先需要遍历文件.这里用两种方法,一种是直接获取指定目录下的所有文件和文件夹.另外一种就是获取指定目录下的文件.文件夹和子文件.文件夹...

  • Python实现批量自动整理文件

    为了实现这样的小工具,我们先设想有下面这些功能. 1.可以自定义整理某一个路径下面的所有需要被整理的文件.2.默认情况下,使用文件后缀作为同一种类文件的文件夹名称,有其他想法的小伙伴可自行扩展. 将使用到的python模块导入到代码块中. import os # 文件/文件夹应用操作 import shutil # 移动文件 import logging # 使用日志logging来打印日志 选择好需要整理的原始文件目录. 下面是整理完成后的效果图,根据文件类型对各种文件进行整理. 在代码块中加

  • Python脚本实现一键自动整理办公文件

    目录 导语: 1.准备 2.原理 3.自定义整理 导语: 举例:Python做一个根据后缀名整理文件的工具,先来看看效果: 自动整理前: 自动整理后: 这样看起来就好很多了. 1.准备 开始之前,你要确保Python和pip已经成功安装在电脑上,如果没有,可以访问这篇文章:python Windows最新版本安装教程 我们只需要修改源代码主程序中调用 auto_organize函数的参数即可完成对对应文件夹的整理,比如我想整理  C:\Users\83493\Downloads 文件夹: if

  • python实现自动整理文件

    前言: 平时工作没有养成分类的习惯,整个桌面杂乱无章都是文档和资料,几乎快占满整个屏幕了.所以必须要整理一下了,今天我们来看下用python如何批量将不同后缀的文件移动到同一文件夹. 演示效果: 使用前 使用后 代码: # # -*- coding:utf-8 -*- import os import glob import shutil import tkinter import tkinter.filedialog from datetime import datetime def star

  • Python实现自动整理文件的脚本

    前言 工作上的文档和资料好几个月没整理了,因为平常太忙都是随手往桌面丢.整个桌面杂乱无章全是文档和资料.几乎快占满整个屏幕了,所有我必须要整理一下了.但是手动整理太费时间了,于是我想到了python. 示例 import os import glob import shutil ''' @Author: huny @date: 2020.12.06 @function: 桌面整理 ''' class FileType(): def __init__(self): self.filetype =

  • Python实现自动化整理文件的示例代码

    目录 自动化整理计算机文件 1. 文件的自动分类 2. 文件和文件夹的快速查找 3. 自动清理重复文件 4. 批量转换图片格式 5. 按拍摄日期自动分类图片 自动化整理计算机文件 通过Python编程完成文件的自动分类.文件和文件夹的快速查找.重复文件的清理.图片格式的转换等常见工作. 1. 文件的自动分类 根据文件的扩展名将文件分类整理到不同文件夹中. 使用os和shutil模块 os模块提供了许多操作文件和文件夹的函数,可对文件或文件夹进行新建.删除.查看属性以及查找路径等操作. shuti

  • Python实现自动整理表格的示例代码

    目录 前言 原理 目标实现 运行效果 前言 今天,在工作的时候,我的美女同事问我有没有办法自动生成一个这样的表格: 第一列是院校+科目,第二列是年份,第三列是数量. 这张表格是基于这一文件夹填充的,之前要一个文件夹一个文件夹打开然后手动填写年份和数量 手动整理需要耗费较长时间,于是我便开发了一个 Python 程序用来自动生成归纳表格 利用正则表达式+OS库+openpyxl生成真题年份归纳表格 原理 第一步,遍历文件夹下的所有文件和子文件夹的名称,并获取子文件夹下的文件的年份信息和数量信息 第

  • Python实现删除重复文件的示例代码

    此程序主要是针对某个目录下的全部文件进行筛选,会删除重复的文件. 原理很简单,会计算每个文件的哈希,将哈希存入一个字典,文件名对应哈希. import os import hashlib def hash_file(filename): """Return the SHA-1 hash of the file content.""" h = hashlib.sha1() with open(filename, 'rb') as f: while

  • python 高效去重复 支持GB级别大文件的示例代码

    如下所示: #coding=utf-8 import sys, re, os def getDictList(dict): regx = '''[\w\~`\!\@\#\$\%\^\&\*\(\)\_\-\+\=\[\]\{\}\:\;\,\.\/\<\>\?]+''' with open(dict) as f: data = f.read() return re.findall(regx, data) def rmdp(dictList): return list(set(dictL

  • Python 保存加载mat格式文件的示例代码

    mat为matlab常用存储数据的文件格式,python的scipy.io模块中包含保存和加载mat格式文件的API,使用极其简单,不再赘述:另附简易示例如下: # -*- coding: utf-8 -*- import numpy as np import scipy.io as scio # data data = np.array([1,2,3]) data2 = np.array([4,5,6]) # save mat (data format: dict) scio.savemat(

  • python操作toml文件的示例代码

    # -*- coding: utf-8 -*- # @Time : 2019-11-18 09:31 # @Author : cxa # @File : toml_demo.py # @Software: PyCharm import toml import os BASE_DIR = os.path.dirname(os.path.abspath(__file__)) class FileOperation: def __init__(self): self.dic = dict() self

  • python实现xml转json文件的示例代码

    使用了Python的 xml.etree.ElementTree 库 xml.etree.ElementTree 库简介 xml.etree.ElementTree模块实现了一个简单而高效的API用于解析和创建XML数据.xml.etree.ElementTree模块对于恶意构造的数据是不安全的.如果您需要解析不受信任或未经验证的数据,请参阅XML漏洞. 参考文献:https://docs.python.org/3.6/library/xml.etree.elementtree.html fro

  • Python实现识别花卉种类的示例代码

    目录 百度图像识别 读取照片文件 整理分类照片 大家好,我是小五 “无穷小亮的科普日常”经常会发布一些鉴定网络热门生物视频,既科普了生物知识,又满足观众们的猎奇心理.今天我们也来鉴定一下网络热门植物!最近春天很多花都开了,我正好趁着清明假期到户外踏青并拍摄了不少花卉的照片. 由于对很多花不是特别熟悉,所以我们需要借助软件来识别究竟是什么花的种类.市面上的识花软件有很多,比如花伴侣.形色.百度等等,我测试后发现百度的识别效果最为优秀.于是我就有了一个想法,能不能批量调用百度的接口,对花卉照片进行识

  • Python办公自动化批量处理文件实现示例

    目录 引言 需求分析 Python实现 结束语 引言 要说在工作中最让人头疼的就是用同样的方式处理一堆文件夹中文件,这并不难,但就是繁.所以在遇到机械式的操作时一定要记得使用Python来合理偷懒!今天我将以处理微博热搜数据来示例如何使用Python批量处理文件夹中的文件,主要将涉及: Python批量读取不同文件夹() Pandas数据处理() Python操作Markdown文件() 需求分析 首先来说明一下需要完成的任务,下面是我们的文件夹结构 因为微博历史热搜是没有办法去爬的,所以只能写

随机推荐