Python实现删除windows下的长路径文件

目录
  • 1.文章背景
  • 2.使用 python 删除文件
  • 3.文件系统关于长路径文件的相关定义
  • 4.改造 python 程序,删除长路径文件
  • 5.总结思考

1.文章背景

近期,笔者所在公司的某业务系统的存储临近极限,服务器马上就要跑不动了,由于该业务系统A包含多个子系统A1、A2、A3 ... An,这些子系统的中间存储文件由于设计原因,都存储在同一个父级目录之内,唯一不同的是,不同子系统产生的文件和文件夹的名字都以该子系统名开始。如A1子系统产生的文件命名方式均为A1xxxxxx, A2子系统产生的文件名均为A2xxxxx。现在要删除其中一些子系统的历史文件,以释放服务器空间,几十T的数据,存放在一起,手动删除肯定不显示,只能借助程序自动化实现了,使用什么呢?自然想到了python。其实单纯删文件这一个需求我认为不值得长篇阔论,但是其中遇到了一些特殊有趣的问题和一些有意思的解决方案,所以想与诸位分享一下,比如windows系统下的超长文件删除, 如从阅读官方英文文档寻找解决方案等等,下面进入正题。

2.使用 python 删除文件

使用python删除文件有很多方式,最直接也是最方便的方式就是调用内建函数:

  • os.remove()  删除文件
  • os.rmdir() 删除一个空文件夹
  • shutil.rmtree() 删除一个文件夹及该文件夹下所有内容(包括子目录及文件)

也就是,此问题的的解决方案,核心就是围绕上述三个函数打交道。转到我们遇到的问题,业务系统A包含多个子系统A1、A2、A3 ... An,这些子系统的中间存储文件由于设计原因,都存储在同一个父级目录之内,唯一不同的是,不同子系统产生的文件和文件夹的名字都以该子系统名开始。如A1子系统产生的文件命名方式均为A1xxxxxx, A2子系统产生的文件名均为A2xxxxx,现在的目的就是要在该删除指定子系统所产生的文件,保留其他子系统的文件。

将需求拆解下,实际上就是解决下列4个问题:1、怎么删除一个文件?2、怎样识别一个文件或文件夹是某个子系统产生的?3、如何判断一个路径是文件还是目录?4、如何定位所有指定的子系统产生的文件和文件夹?

对于问题1, 在本节开始就阐述过,使用 python 的内建函数进行删除即可:

os.remove("path") # 删除指定文件
os.rmdir("path") # 删除一个空文件夹
shutil.rmtree("path") #  删除一个文件夹及该文件夹下所有内容(包括子目录及文件)

对于问题2,由于特定子系统产生的文件和文件夹的命名方式都是固定的模式,如A1子系统产生的文件名均为A1xxxxx,故可通过关键字匹配的方式进行识别。一种可能的方式为:

if keywords in filepath: # 如果文件名包含关键字keywords
    os.remove(filepath) # 删除文件
else:
    pass

对于问题3,由于删除目录和删除文件的方式不一致,故需要在删除前判断一个路径是目录还是文件,根据其类型选择合适的删除方式,这个在 python 中可以使用 **os.path.isdir()**之类的函数进行判断,主要是下列函数:

os.path.isdir("path") # 返回true则为目录,false则为文件
os.path.isfile("path") # 返回true则为文件,false则为目录

对于问题4,如何定位所有要删除的文件,这个问题实际上就是一个指定目录文件遍历的问题,即如何遍历一个指定目录的所有文件夹及文件。对于这个问题,一般有两种解决方案,一是深度优先遍历方式,一是广度优先遍历方式,两种方式在本例中效率是一致的,因为我们最终都要遍历所有的文件。另外,幸运的是,python实在是过于强大,其内建的函数已经帮助我们实现了一个广度优先目录遍历方法,及 os.walk("path") 方法,该方法就是遍历 path 目录下的所有文件及文件夹,一个典型的用法如下:

import os

path = "C:\\A\\"

for root, dirs, files in os.walk(path):
    print(root)
    print(dirs)
    print(files)

上例中,root 代表当前遍历到的路径,dirs 表示当前路径下所有的子目录, files 表示当前路径下的所有子文件。通过这种方式就能全部遍历指定目录了。

问题都分解开了,下面将问题组合一下就完成代码实现.

最终的代码实现为:

import os
import shutil

path = "C:\\A\\"
keyword = "A1"

for root, dirs, files in os.walk(path):
    for dir in dirs:
        if keyword in dir:
            rmpath = os.path.join(root, dir)
            print("删除文件夹: %s" % rmpath)
            shutil.rmtree(rmpath)
    for file in files:
        if keyword in file:
            rmpath = os.path.join(root, file)
            print("删除文件: %s" % rmpath)
            os.remove(rmpath)

即通过广度优先方式(os.walk())遍历指定目录,逐个判断该目录下所有子目录和文件是否满足关键字条件,满足就删除。

运行效果为:

看似需求到此基本上就很好的解决了,但是实际测试中发现有的很深的目录却没有删除,删除该目录时报了一个错,错误描述如下:

Unexpected error: (< type 'exceptions.WindowsError'>, WindowsError(3, 'The system cannot find the path specified'), < traceback object at 0x0000000002714F88>)

大致意思就是python找不到这个路径,可是为什么呢?为此,我继续进行一番资料查询,后来大致定位了是由于文件路径过长导致的,是由于windows系统用户态的默认路径长度不能超过256个字节导致的。但是官方说256个字节是最长,但为何能创建超过256的呢,所以既然能创建,那就一定能删除,但是需要一些方法,经过一番学习,找到了好几种方法,下面介绍其中一种最为实用的方法,另外几个比如使用压缩软件压缩后删除(百度知道的结果)适合手动但不适合编程解决。这个方法在下一节中继续讲述。

3.文件系统关于长路径文件的相关定义

为解决windows下的长文件删除的问题,最为权威的资料莫过于windows官方的描述,我阅读了微软关于文件名长度的这一块的定义及说明,找到解决方案,微软的原文如下:

关键意思如下:1、Windows API 提供的文件路径理论上最长是 32767 个字节,普通状态下给用户使用是不超过256个字符,说是为了使用户操作更加方便。这里不得不吐槽一下了,确实操作方便了,但是方便的同时也可能带来不便,明明定义了32767这么长的字节,只给用256,未免太抠搜了一点

2、用户如果想要打破这个长度限制,可以通过一个特殊方式告诉windows系统自己想要使用超长文件,这个特殊的方式就是在绝对路径前加上** "\?" **字符串。

3、这篇文档后面还有描述在windows10以后如何通过注册表的方式接触文件名长度限制,这里就没有截图了,因为不通用,win7怎么办呢?有兴趣的同学可以查看其原文链接阅读

好了,看到这,解决方法呼之欲出,其实简单得不能太简单,直接在绝对路径前加上一个"\?"即可:

# 获取目标路径的绝对路径,并在路径前加上\\?\,
# 以解除windows的文件长度限制
path = '\\\\?\\' + os.path.abspath(path)

4.改造 python 程序,删除长路径文件

根据上一节,对python程序进一步进行改造,加入windows长文件名限制解除,最后的完美删除工具就成型了:

import os
import shutil

path = "C:\\A\\"
keyword = "A1"

# 获取目标路径的绝对路径,并在路径前加上\\?\,
# 以解除windows的文件长度限制
path = '\\\\?\\' + os.path.abspath(path)

for root, dirs, files in os.walk(path):
    for dir in dirs:
        if keyword in dir:
            rmpath = os.path.join(root, dir)
            print("删除文件夹: %s" % rmpath)
            shutil.rmtree(rmpath)
    for file in files:
        if keyword in file:
            rmpath = os.path.join(root, file)
            print("删除文件: %s" % rmpath)
            os.remove(rmpath)

虽然代码很短,只添加了一行,但是这一行,却完成了一个超级核心的任务,真可谓是灵魂一行啊,最后该工具中如在生产环境中发挥了其出色的作用,使服务器继续运转如飞了。

5.总结思考

啰嗦的话就不多说了,说几点思考

1、遇到问题将问题进行分解,拆分成一个个小问题逐步击破

2、要善于阅读官方技术文档,有时候解决一个问题的核心可能很简单,代码可能也就一行两行,但是就是藏在某个角落,不仔细去阅读还真不一定找得出来

3、python是个好东西,要有将问题转化成使用python去解决的习惯,习惯成自然,python可能在工作中就发挥大作用了呢。

到此这篇关于Python实现删除windows下的长路径文件的文章就介绍到这了,更多相关Python删除长路径文件内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 使用python如何删除同一文件夹下相似的图片

    前言 最近整理图片发现,好多图片都非常相似,于是写如下代码去删除,有两种方法: 注:第一种方法只对于连续图片(例一个视频里截下的图片)准确率也较高,其效率高:第二种方法准确率高,但效率低 方法一:相邻两个文件比较相似度,相似就把第二个加到新列表里,然后进行新列表去重,统一删除. 例如:有文件1-10,首先1和2相比较,若相似,则把2加入到新列表里,再接着2和3相比较,若不相似,则继续进行3和4比较-一直比到最后,然后删除新列表里的图片 代码如下: #!/usr/bin/env python #

  • Python删除windows垃圾文件的方法

    本文实例讲述了Python删除windows垃圾文件的方法.分享给大家供大家参考.具体如下: #coding:utf-8 import os #from glob import glob if os.name == 'nt': if 'HOMEPATH' in os.environ: home = os.environ['HOMEDRIVE'] + os.environ['HOMEPATH'] else: home = os.environ['HOMEPATH'] workpath = os.p

  • Python 实现删除某路径下文件及文件夹的实例讲解

    Python 实现删除某路径下文件及文件夹的脚本 #!/usr/bin/env python import os import shutil delList = [] delDir = "/home/test" delList = os.listdir(delDir ) for f in delList: filePath = os.path.join( delDir, f ) if os.path.isfile(filePath): os.remove(filePath) print

  • 教你用Python寻找重复文件并删除的脚本写法

    在实际生活中,经常会有文件重复的困扰,即同一个文件可能既在A目录中,又在B目录中,更可恶的是,即便是同一个文件,文件名可能还不一样.在文件较少的情况下,该类情况还比较容易处理,最不济就是one by one的人工比较——即便如此,也很难保证你的眼神足够犀利.倘若文件很多,这岂不是个impossible mission?最近在看<Python UNIX和Linux系统管理指南>,里面就有有关“数据比较”的内容,在其基础上,结合实际整理如下. 该脚本主要包括以下模块:diskwalk,chechs

  • 基于python实现删除指定文件类型

    Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构. Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节.类似于PHP和Perl语言. Python 是交互式语言: 这意味着,您可以在一个 Python 提示符 >>> 后直接执行代码. Python 是面向对象语言: 这意味着Python支持面向对象的风格或代码封

  • 利用Python删除电脑中重复文件的方法

    目录 前言 练习 代码演示 总结 前言 在生活中,我们经常会遇到电脑中文件重复的情况.在文件较少的情况下,这类情况还比较容易处理,最不济就是一个个手动对比删除:而在重复文件很多的时候,我们很难保证把重复文件全部删完.下面文章就来简单介绍便捷一个小方法,用Python来删除重复文件 练习 Python提供一个内置电脑文件管理库os模块,我们可以利用它来删除多余文件. 当一个文档里存在重复文件名,我们的系统会自动给我们重复的文件名更名, 比如下图的文件“1”重复了3次:  那我们该怎么删除文件“1”

  • Python实现删除windows下的长路径文件

    目录 1.文章背景 2.使用 python 删除文件 3.文件系统关于长路径文件的相关定义 4.改造 python 程序,删除长路径文件 5.总结思考 1.文章背景 近期,笔者所在公司的某业务系统的存储临近极限,服务器马上就要跑不动了,由于该业务系统A包含多个子系统A1.A2.A3 ... An,这些子系统的中间存储文件由于设计原因,都存储在同一个父级目录之内,唯一不同的是,不同子系统产生的文件和文件夹的名字都以该子系统名开始.如A1子系统产生的文件命名方式均为A1xxxxxx, A2子系统产生

  • Python实现删除当前目录下除当前脚本以外的文件和文件夹实例

    本文实例讲述了Python实现删除当前目录下除当前脚本以外的文件和文件夹.分享给大家供大家参考.具体如下: import os,sys import shutil cur_file = os.path.basename(sys.argv[0]) dir_content = [x for x in os.listdir(".") if x != cur_file] for f in dir_content: if os.path.isdir(f): shutil.rmtree(f) el

  • python实现在windows下操作word的方法

    本文实例讲述了python实现在windows下操作word的方法.分享给大家供大家参考.具体实现方法如下: import win32com from win32com.client import Dispatch, constants w = win32com.client.Dispatch('Word.Application') # 或者使用下面的方法,使用启动独立的进程: # w = win32com.client.DispatchEx('Word.Application') # 后台运行

  • 用python写一个windows下的定时关机脚本(推荐)

    由于本人经常使用笔记本共享WiFi,但是又不想笔记本开机一夜(为了低碳环保嘛 ~_~!),所以每次都要用使用DOS命令关机,感觉好麻烦.正好最近在学习Python,于是决定用python写一个定时关机的脚本: 话不多说由于代码比较简单,直接上代码. 代码块 # -*- coding: utf-8 -*- """ Created on Sat Dec 19 11:18:16 2015 @author: win7 """ '''定时关机''' '''

  • Python读取一个目录下所有目录和文件的方法

    本文实例讲述了Python读取一个目录下所有目录和文件的方法.分享给大家供大家参考,具体如下: 这里介绍的是刚学python时的一个读取目录的列子,给大家分享下: #!/usr/bin/python # -*- coding:utf8 -*- import os allFileNum = 0 def printPath(level, path): global allFileNum ''' 打印一个目录下的所有文件夹和文件 ''' # 所有文件夹,第一个字段是次目录的级别 dirList = [

  • Perl实现删除Windows下的图片缓存缩略图Thumbs.db

    接手以前别人做的项目,发现SVN里的ignore里并没有对*.db处理,导致图片的缓存缩略文件都被提交了,而我只要打开图片文件夹,就意味着Thumbs.db发生了改变. 要做的事情有两个: 一.更改svn的设置,以后不再提交Thumbs.db文件 二.批量删除指定目录下的Thumbs.db文件 所以用perl写了一个,代码是在之前的 perl遍历目录 做了一些修改,主要有两点自己注意了: 一.文件路径,Windows下默认为"\  "而linux下则是"/", 所以

  • Windows下使用命令实现文件换行符替换

    有这么些数据文件,一行一条数据.然后在某些时候需要合并成一整行,数据之间用逗号分隔. 如果在 Linux 下是有N种方法来处理: Windows 下如果使用 EditPlus 或 UltraEdit 等文本编辑器直接进行正则替换也就行了.可碰巧问这个问题的同志从来没听说过这些东西,想在 Windows 下想找个比较便捷的内建工具来做,兜了一圈又一圈,发现还是得靠命令行来"曲线救国": 复制代码 代码如下: for /f "delims=" %i in (src.tx

  • Windows下PHP的任意文件执行漏洞

    受影响系统: PHP version 4.1.1 under Windows PHP version 4.0.4 under Windows  漏洞描述:  在Windows下的PHP,通过PHP.EXE,攻击者可以让任何文件作为一个php文件,即使这个文件的扩展名不是php.比如,上传一个文件,但是扩展名是mp3,txt,或者gif等等,然后要求PHP去执行它. 例如: 上传一个gif文件,但是实际上是一个php脚本文件,文件内容如下: #-------

  • Windows下PHP安装路径配置错误导致Apache无法启动的解决方法

    LoadModule php5_module "C(/D):/Program Files/php5/php5apache2_2.dll"  PHP安装路径引起的apache无法启动错误 今天给一同事的PC机安装部署web服务的时候,按同事要求把所有程序文件放到安装目录的program files下,于是我把apache安装到了c:\program files下面,php也安装在c:\program files下.装完MySql,配置好apache和php的配置文件后,重起发现问题了 A

  • Python+Django在windows下的开发环境配置图解

    1         安装配置开发环境 1.1   准备安装 下载以下软件 Eclipse for C/C++ SUN JDK 1.6 不一定要1.6,1.5的也可以 Python3.1  Python2.6.4  Pythone2.5.2 mod_python-3.3.1.win32-py2.5-Apache2.2 MySQL-python-1.2.2.win32-py2.5 pysqlite-2.5.5.win32-py2.5 python.pydev.feature-1.5.0.125198

随机推荐