详解Python文本操作相关模块

2025-02-26 17:05:25

详解Python文本操作相关模块

linecache——通过使用缓存在内部尝试优化以达到高效从任何文件中读出任何行。

主要方法：

linecache.getline(filename, lineno[, module_globals]):获取指定行的内容
linecache.clearcache()：清除缓存
linecache.checkcache([filename]):检查缓存的有效性

dircache——定义了一个函数，使用缓存读取目录列表、使用目录的mtime来实现缓存失效。此外还定义了标注目录的方法。

主要方法：

dircache.reset():重置目录缓存。
dircache.listdir(path):返回path的目录列表。除非path改变，否则再次调该方法会会重复读目录结构。
dircache.opendir(path):和listdir功能相同。存在的目的是为了后向兼容。
dircache.annotate(head,list):假设list是相对于head的路径列表，那么在合适的位置给每个是目录的路径添加“/”

filecmp——定义了文件和目录比较的函数。

主要方法：

filecmp.cmp(f1, f2[, shallow])：比较两个文件是非相等
filecmp.cmpfiles(dir1, dir2, common[, shallow])：比较两个目录下的相同文件名的文件是非相等。

类： class filecmp.dircmp(a, b[, ignore[, hide]])：构建一个新的目录比较对象，比较a和b。

fileinput——实现了辅助类和方法来帮助实现对标准输入或一串文本快速操作。

主要方法：

fileinput.input([files[, inplace[, backup[, bufsize[, mode[, openhook]]]]]])：创建一个 FileInput实体。
fileinput.filename()：返回当前读取的文件名
fileinput.lineno()：返回累积读取的行数
fileinput.nextfile()：关闭当前行，下个迭代会跳到去读取下一个文件的第一行。
类： class fileinput.FileInput([files[, inplace[, backup[, bufsize[, mode[, openhook]]]]]])

os.path——包括路径以及文件属性方面的操作。

主要方法：

os.path.abspath(path):返回path的绝对路径
os.path.dirname(path)：返回path的目录名称
os.path.exists(path)：判断路径是否存在
os.path.getatime(path)：返回path上次访问的时间
os.path.getmtime(path)：返回path上次修改时间

shutil——提供了一些文件和文件集方面的高级操作。

主要方法：

shutil.copyfileobj(fsrc, fdst[, length])：将类文件对象fsrc的内容复制到类文件对象fdst
shutil.copyfile(src, dst):将文件src的内容（不包括元数据）的内容复制到文件dst
shutil.copymode(src, dst):将src的权限位复制给dst
shutil.copystat(src, dst):复制权限位、最近访问时间、最近修改时间和flags。
shutil.copy(src, dst)：复制文件src到文件或目录dst。权限位也会被复制。
shutil.copy2(src, dst):和copy()不同之处是还会复制元数据。类似先copy(),再copystat()
shutil.rmtree(path[, ignore_errors[, onerror]])：删除整个目录树
shutil.move(src, dst):递归移动文件或路径

除了操作一般文件，还能操作归档文件

shutil.make_archive(base_name, format[, root_dir[, base_dir[, verbose[, dry_run[, owner[, group[, logger]]]]]]]):创建归档文件。
tempfile—— 生成临时文件和目录

主要方法：

tempfile.TemporaryFile([mode='w+b'[, bufsize=-1[, suffix=”[, prefix='tmp'[, dir=None]]]]])：返回一个能够作为临时存储区域的类文件对象。
tempfile.mkstemp([suffix=”[, prefix='tmp'[, dir=None[, text=False]]]])：以尽可能最安全的方式创建一个临时文件。

stat——返回文件的系统状态信息等。

struct——二进制文件的操作。包括二进制数据类型和str之间的转换。

除此之外，还有其他专门针对特定类型文件（类文件）操作的模块。比如： lxml、CSV、 zipfile、 tarfile等。

感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

Python实现简单过滤文本段的方法

本文实例讲述了Python实现简单过滤文本段的方法.分享给大家供大家参考,具体如下: 一.问题: 如下文本: ## Alignment 0: score=397.0 e_value=8.2e-18 N=9 scaffold1&scaffold106 minus 0- 0: 10026549 10007782 2e-75 0- 1: 10026550 10007781 8e-150 0- 2: 10026552 10007780 1e-116 0- 3: 10026555 10007778 0 0
Python批量修改文本文件内容的方法

Python批量替换文件内容,支持嵌套文件夹 import os path="./" for root,dirs,files in os.walk(path): for name in files: #print name if name.endswith(".html"): #print root,dirs,name filename=root+"/"+name f=open(filename,"r") fileconten
Python实现的文本简单可逆加密算法示例

本文实例讲述了Python实现的文本简单可逆加密算法.分享给大家供大家参考,具体如下: 其实很简单,就是把一段文本每个字符都通过某种方式改变(比如加1) 这样就实现了文本的加密操作,解密就是其逆运算 # -*-coding:utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf8') #加密 def jiami(): filename=raw_input('please input file:\n') while True: tr
Python 专题五列表基础知识（二维list排序、获取下标和处理txt文本实例）

通常测试人员或公司实习人员需要处理一些txt文本内容,而此时使用Python是比较方便的语言.它不光在爬取网上资料上方便,还在NLP自然语言处理方面拥有独到的优势.这篇文章主要简单的介绍使用Python处理txt汉字文字.二维列表排序和获取list下标.希望文章对你有所帮助或提供一些见解~ 一. list二维数组排序功能:已经通过Python从维基百科中获取了国家的国土面积和排名信息,此时需要获取国土面积并进行排序判断世界排名是否正确. 列表基础知识列表类型同字符串一样也是序列式的数据类型,
Python读写txt文本文件的操作方法全解析

一.文件的打开和创建 >>> f = open('/tmp/test.txt') >>> f.read() 'hello python!\nhello world!\n' >>> f <open file '/tmp/test.txt', mode 'r' at 0x7fb2255efc00> 二.文件的读取步骤:打开 -- 读取 -- 关闭 >>> f = open('/tmp/test.txt') >>&
Python实现统计文本文件字数的方法

本文实例讲述了Python实现统计文本文件字数的方法.分享给大家供大家参考,具体如下: 统计文本文件的字数,从当前目录下的file.txt取文件 # -*- coding: GBK -*- import string import sys reload(sys) def compareItems((w1,c1), (w2,c2)): if c1 > c2: return - 1 elif c1 == c2: return cmp(w1, w2) else: return 1 def main()
Python文件操作,open读写文件,追加文本内容实例

1.open使用open打开文件后一定要记得调用文件对象的close()方法.比如可以用try/finally语句来确保最后能关闭文件. file_object = open('thefile.txt') try: all_the_text = file_object.read( ) finally: file_object.close( ) 注:不能把open语句放在try块里,因为当打开文件出现异常时,文件对象file_object无法执行close()方法. 2.读文件读文本文件input
Python如何实现文本转语音

准备我测试使用的Python版本为2.7.10,如果你的版本是Python3.5的话,这里就不太适合了. 使用Speech API 原理我们的想法是借助微软的语音接口,所以我们肯定是要进行调用相关的接口.所以我们需要安装pywin32来帮助我们完成这一个底层的交互. 示例代码 import win32com.client speaker = win32com.client.Dispatch("SAPI.SpVoice") speaker.Speak("Hello, it
详解Python文本操作相关模块

详解Python文本操作相关模块 linecache--通过使用缓存在内部尝试优化以达到高效从任何文件中读出任何行. 主要方法: linecache.getline(filename, lineno[, module_globals]):获取指定行的内容 linecache.clearcache():清除缓存 linecache.checkcache([filename]):检查缓存的有效性 dircache--定义了一个函数,使用缓存读取目录列表.使用目录的mtime来实现缓存失效.此外还定义
详解Python import方法引入模块的实例

详解Python import方法引入模块的实例在Python用import或者from-import或者from-import-as-来导入相应的模块,作用和使用方法与C语言的include头文件类似.其实就是引入某些成熟的函数库和成熟的方法,避免重复造轮子,提高开发速度. python的import方法可以引入系统的模块,也可以引入我们自己写好的共用模块,这点和PHP非常相似,但是它们的具体细节还不是很一样.因为php是在引入的时候指明引入文件的具体路径,而python中不能够写文件路径进
详解Python自建logging模块

简单使用最开始,我们用最短的代码体验一下logging的基本功能. import logging logger = logging.getLogger() logging.basicConfig() logger.setLevel('DEBUG') logger.debug('logsomething') #输出 out>>DEBG:root:logsomething 第一步,通过logging.getLogger函数,获取一个loger对象,但这个对象暂时是无法使用的. 第二步,loggi
详解nodejs 文本操作模块-fs模块（三）

下面继续nodejs的学习,在前两篇中,已经把文件操作的打开,关闭读写这两个最基本的功能进行了简单的说明,它们的强大之处,让我觉得知道这几种方法之后,基本上就可以随意的操作文件了,但是open,read,write等方法,需要操作的参数确实是有点多的,所以,基于让使用者更简单的完成读写操作,开发者们,继续给这些方法做了进一步的封装,也就是本文接下来将要说的readFile,和writeFile方法,当然也有他们的同步执行方法,只是篇幅有限,并且同步的方法和异步的方法,在内部实现和参数使用中,差别
详解Python中的PyInputPlus模块

目录安装PyInputPlus 关键字参数min.max.greaterThan和lessThan 关键字参数blank 关键字参数limit.timeout和default 关键字参数allowRegexes和blockRegexes 将自定义验证函数传递给inputCustom() “输入验证”代码检查用户输入值,在Python中我们用的最多的是input()函数,但是有些情况下反复使用input()函数可能会遗漏某些场景,并且该函数允许无效输入通过检查.因此我们需要使用Python的第三
详解python中的hashlib模块的使用

hashlib hashlib主要提供字符加密功能,将md5和sha模块整合到了一起,支持md5,sha1, sha224, sha256, sha384, sha512等算法 hashlib模块 #哈希算法也叫摘要算法,相同的数据始终得到相同的输出,不同的数据得到不同的输出. #(1)哈希将不可变的任意长度的数据,变成具有固定长度的唯一值 #(2)字典的键值对映射关系是通过哈希计算的,哈希存储的数据是散列(无序) # 应用场景:在需要效验功能时使用用户密码的 => 加密,解密相关效验的
详解Python编程中time模块的使用

一.简介 time模块提供各种操作时间的函数说明:一般有两种表示时间的方式: 第一种是时间戳的方式(相对于1970.1.1 00:00:00以秒计算的偏移量),时间戳是惟一的第二种以数组的形式表示即(struct_time),共有九个元素,分别表示,同一个时间戳的struct_time会因为时区不同而不同 year (four digits, e.g. 1998) month (1-12) day (1-31) hours (0-23) minutes (0-59) seconds (0-5
详解nodejs 文本操作模块-fs模块（五）

fs模块是一个比较庞大的模块,在前面也介绍了该模块中最核心的一点东西,虽然核心的这点东西,在整个fs模块中占据的比例比较小,但是如果只是我们平常使用的话,基本已经够用了,其他的一些方法,属于能力提升时需要学习的的内容了,所以在后面就不再继续了,本篇属于fs模块中的最后一篇,也不是把fs模块中的其他API都给一一列举出来,这里再说最后一个我看来很重要的方法,监听文件或者目录的的方法watchFile. 概总这里之所以在最后把这个watchFile方法写入到这里,是因为在前端的一个流行的构建工具g
详解nodejs 文本操作模块-fs模块（二）

前一篇学习了文件的打开和关闭,文件操作总不能只包含打开和关闭吧,这里就开始文件的读写操作. fs模块方法 1:read和readSync方法该方法,是从文件的指定位置处读取文件,一直读取到文件底部,然后江都区到的内容输出到一个缓存区,使用方法如下: fs.read(fd,buffer,offset,length,position,callback); 在read方法中,支持6个参数: fd参数,是文件描述符,是open方法的回调函数中获取到的,是一个数字. buffer,是一个buffer对象
详解nodejs 文本操作模块-fs模块（一）

JS的安全性问题,就决定了JS想要取操作数据库操作文件是不可实现的,而Nodejs作为服务端的JS,如果依然不能操作文件,那么又如何称之为服务端语言呢,所以在Nodejs中,提供了一个fs(File System)模块,以实现文件及目录的读写操作. 写在前面 Nodejs的一大优势就在于,支持异步调用,不管是在读取数据库,还是在读取文件时,都可以使用异步的方式进行处理,这样就可以处理高并发的情况,从本篇开始,开始对Nodejs的fs模块中,一些重要的API,结合源码,进行一些说明学习. fs模块

详解Python文本操作相关模块

相关推荐

随机推荐