利用python进行文件操作

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14084898.html

什么是文件

文件是系统存储区域的一个命名位置,用来存储一些信息,便于后续访问。能够在非易失性存储器中实现持续性存储,比如在硬盘上。当我们要读取或者写入文件时,我们需要打开文件;在操作完毕时,我们需要关闭文件,以便释放和文件操作相关的系统资源,因此,文件操作的主要包括以下:

打开文件

  • 读取或者写入
  • 关闭文件
  • 打开文件

Python使用内置的open()函数打开一个文件,并且返回一个文件对象,也叫句柄(handle)。

f = open("test.txt") # 在本文件夹下面的一个文件
f = open("C:/Python33/README.txt") # 全路径

再打开文件时,我们需要指定文件打开的模式,当我们需要读取文件时,使用f = open("test.txt", 'r'),写入文件时,使用f = open("test.txt", 'w'),追加输入时f = open("test.txt", 'a'),这里的a就是append的意思。追加模式和写入模式的区别就是,写入模式打开一个文件时,无论这个文件是否有内容,都会被清空再写入;在使用追加模式时,打开的文件,只是在原有的内容上继续进行写入。同时我们也要制定以文本模式打开还是二进制模式打开。

文本模式(text mode)和二进制(binary mode)模式的区别

文本模式中,读取时操作系统的换行符('\n' on Unix,'\r\n' on Windows)会被转换成Python的默认换行符\n,写入时会将默认的换行符转换为操作系统的换行符;在二进制模式中不会转换。这个转化在对文本文件没有影响,但是对于二进制数据会有影响,比如图像文件或者EXE文件等。因此, 再打开这类文件时,一般使用二进制模式进行读写

常用模式

r 文本模式,读取
rb 二进制模式,读取
w 文本模式,写入
wb 二进制模式,写入
a 文本模式,追加
ab 二进制模式,追加
+ 可读可写
f = open("test.txt", 'r') # 读模式
f = open("test.txt", 'w') # 写模式
f = open("img.bmp",'r+') # 可读可写
f = open("img.bmp",'w+') # 可读可写
f = open("img.bmp",'rb') # 二进制读取

如何关闭文件

当文件操作结束时,我们最好主动关闭文件。尽管Python有垃圾回收(garbage collector)机制,去清理不用的对象,但是最好还是自己关闭文件。
最简单的方法就是:

f = open("app.log", 'r')
do_something()
f.close()

但是这个办法不安全,因为在进行其他操作时,可能会出现异常,程序退出,那么关闭文件的语句就不会被执行。
因此,可以用语句来处理:

try:
 f = open('app.log', 'r')
 do_something()
finally:
 f.close()

无论是否发生异常,关闭文件的指令都会被执行。
但是python官方给出的最佳用法是:

with open('app.log', 'r') as f:
 do_something()

使用这种用法,我们不必调用close()方法,在with语句程序内部就会执行,无论内部是否出现异常。with语句被称为上下文管理器,我们可以暂且不管这个的原理,只需要知道使用with语句,关闭文件的操作会被自动执行,这也是官方推荐的最佳用法,比用语句写起来简单。

文件操作

写入文件
主要介绍两个方法:

1.write()方法
这个方法的参数是一个单独的字符串,比如:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 s = ''
 for data in lines:
  s += data
  s += '\n'
 f.write(s)

其实更好的写法是使用join函数:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 f.write('\n'.join(lines))

其实更加优雅的写法,可以使用生成器:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 f.writelines("%s\n" % l for l in lines)

读取文件

这里介绍四种用法,后面都默认文件已经被打开了:
1.read()方法

result = f.read()

这里返回的是文件内容,是str类型的结果,这个方法还带一个数值类型的参数,指定读取多少内容,如果省略了或者是负数,那么就返回文件的全部内容。
2.readline()方法

result = f.readline()

返回的也是字符串,不过是一行内容,继续调用,就会返回下一行内容
3.readlines()方法

result = f.readlines()

这里返回的是一个列表,但是当数据较大时,这样的用法会很占用内存,不推荐在数据量大时使用
4.直接循环文件对象

for line in f:
 print line
 do_something()

这样的用法节省内存,快速,并且代码还简单

result = f.readlines()
------------------------
result = list(f)

这两种写法返回的结果是一样的
显然我们推荐第四种用法。

如何处理大文件
大文件主要问题在于占用内存较大,我们不能一下子将文件全部内容读入内存,最好的做法如下:

with open("log.txt") as f:
 for line in f:
  do_something_with(line)

一行一行读取,内存不会爆,同时速度也更快,使用with语句,无论内部是否出现异常,在结束时,文件对象都会被关闭,因此在处理大文件时,最好这样来做。

以上就是利用python进行文件操作的详细内容,更多关于python 文件操作的资料请关注我们其它相关文章!

(0)

相关推荐

  • Python文件操作及内置函数flush原理解析

    1.打开文件得到文件句柄并赋值给一个变量 2.通过句柄对文件进行操作 3.关闭文件 示例文件 '你好呀' 我是于超 嗯 再见 文件操作基本流程 f=open('chenli',encoding='utf-8') first_line=f.readline() print('第一行是:',first_line) print('我是分割线'.center(9,'-')) #9代表字符串总共9长度 data=f.read() #读取所有内容 print(data) #不指定打开编码,即python解释

  • Python 添加文件注释和函数注释操作

    1.文件添加方式: pycharm提供了一个在新建文件自动生成文件头注释的功能,可以实现自动生成运行环境,作者.日期等必要信息,使用比较方便,配置十分简单. #!C:\pythonCode # -*- coding: utf-8 -*- # @Time : ${DATE} ${TIME} # @Author : hlx # @File : ${NAME}.py # @Software: ${PRODUCT_NAME} 2.自动生成函数注释,包括参数和返回值.使用方法,函数定义时,直接输入三个双引

  • python--shutil移动文件到另一个路径的操作

    使用shutil.move(src, dst),src为要移动的文件的路径,dst为目的路径,路径必须是绝对路径 import os import shutil work_dir = os.getcwd() # 获取绝对路径 src = os.path.join(work_dir, 'images', '%s.png' % name) dst = os.path.join(work_dir, 'box-images', '%s.png' % name) shutil.move(src, dst)

  • python打包多类型文件的操作方法

    环境win10, python3.7,pyinstaller3.6 一 下载pyinstaller (1)cmd中pip install pyinstaller (2)pycharm中file-settings-project Interpreter----右上角'+'----搜索puinstaller----install package 成功即可! 二 主程序打包 打开cmd,cd到程序文件夹位置 由于文件夹中有多个子文件夹,包含多个程序,找到主程序的位置, 使用命令行:pyinstalle

  • Python txt文件常用读写操作代码实例

    python读取txt文件 #方式一: file = r'D:\test.txt' with open(file, 'rb+') as f: #可读可写二进制,文件若不存在就创建 data = f.readlines() #读取文本所有内容,并且以数列的格式返回结果,一般配合for in使用 print(data) #方式二: file = r'D:\test.txt' f = open(file,"rb+") #可读可写二进制,文件若不存在就创建 data = f.readlines

  • Python自动化测试中yaml文件读取操作

    什么是yaml 一种标记语言.yaml 是专门用来写配置文件的语言,非常简洁和强大 更直观,更方便,有点类似于json格式 yaml文件格式:test.yaml 安装yaml pip install pyyaml yaml基本语法规则 大小写敏感 使用缩进表示层级关系 缩进时不允许使用Tab键,只允许使用空格. 缩进的空格数目不重要,只要相同层级的元素左侧对齐即可 #表示注释,从这个字符一直到行尾,都会被解析器忽略,这个和python的注释一样 键值对(dict) yaml文件 user: ad

  • python3 循环读取excel文件并写入json操作

    文件内容: excel内容: 代码: import xlrd import json import operator def read_xlsx(filename): # 打开excel文件 data1 = xlrd.open_workbook(filename) # 读取第一个工作表 table = data1.sheets()[0] # 统计行数 n_rows = table.nrows data = [] # 微信文章属性:wechat_name wechat_id title abstr

  • python文件操作seek()偏移量,读取指正到指定位置操作

    python 文件操作seek() 和 telll() 自我解释 file.seek()方法格式: seek(offset,whence=0) 移动文件读取指针到制定位置 offset:开始的偏移量,也就是代表需要移动偏移的字节数. whence: 给offset参数一个定义,表示要从哪个位置开始偏移:0代表从文件开头算起,1代表开始从当前位置开始算起,2代表从文件末尾开始算起.当有换行时,会被换行截断. seek()无返回值,故值为None tell() : 文科文件的当前位置,即tell是获

  • python操作toml文件的示例代码

    # -*- coding: utf-8 -*- # @Time : 2019-11-18 09:31 # @Author : cxa # @File : toml_demo.py # @Software: PyCharm import toml import os BASE_DIR = os.path.dirname(os.path.abspath(__file__)) class FileOperation: def __init__(self): self.dic = dict() self

  • python操作ini类型配置文件的实例教程

    一.ini文件介绍 INI文件格式是某些平台或软件上的配置文件的非正式标准,以节(section)和键(key)构成,常用于微软Windows操作系统中.这种配置文件的文件扩展名多为INI 二.ini文件的结构 片段[section] 键名 option 值 value 三.实例: 实例1 python25.ini [teachers] name = ['yushen', 'pianpian'] age = 16 gender = '女' favor = {"movie": "

  • Python xlrd/xlwt 创建excel文件及常用操作

    一.创建excel代码 备注:封装好了(可直接调用) """ -*- coding:utf-8 -*- @Time :2020/8/20 21:02 @Author :Jarvis @File :jar_excel_util.py @Version:1.0 """ from typing import List import xlwt class JarExcelUtil: def __init__(self, header_list: List

  • Python中logging日志记录到文件及自动分割的操作代码

    日志作为项目开发和运行中必备组件,python提供了内置的logging模块来完成这个工作:借助 TimedRotatingFileHandler 可以按日期自动分割日志,自动保留日志文件数量等,下面是对日志的一个简单封装和测试. import logging import os from logging import handlers class Logger(object): # 日志级别关系映射 level_relations = { 'debug': logging.DEBUG, 'in

  • python中查看.db文件中表格的名字及表格中的字段操作

    1.问题描述: 我桌面上有一个"账号密码.db"文件,我现在想知道里面有几张表格table.表格的名字.表头结构. 2.使用SQL语句"""select name from sqlite_master where type='table' order by name""",查找表格的名字.实例代码如下: # coding:utf-8 import sqlite3 conn = sqlite3.connect("C:\

随机推荐