Python3读取文件的操作详解

2025-03-30 00:04:09

1、引言

小鱼：小屌丝，这段代码为什么要开两个线程？

小屌丝：因为我要读写文件，还要备份文件，所以就开两个线程了。

小鱼：嗯，想法是对的，但是，还有一种简便的方法，不需要开两个线程就能搞得定的。

小屌丝：额…难道是with open?

小鱼：不是。

小屌丝：那还有啥呢？我咋想不起来了。

小鱼：嗯，这个方法很奈斯，但是很少人使用，因为大部分码农都是直接open 文件的。

小屌丝：那你就别藏着掖着了，赶紧展示一下，让我也长长见识。

2、 fileinput

说到fileinput，可能90%的码农表示没用过，甚至没有听说过。

这不奇怪，因为在python界，既然open可以走天下，何必要fileinput呢？。

但是，今天小鱼还是要介绍fileinput这个方法，因为太奈斯了。

不止是香。是真香！

接下来，就跟着小鱼，一起fileinput，对，就是这个feel。

2.1 方法介绍

2.1.1 基本用法

先来看一下fileinput的基本功能：

fileinput.filename()：返回当前被读取的文件名。

—>在第一行被读取之前，返回 None。

fileinput.fileno()：返回以整数表示的当前文件“文件描述符”。

—>当未打开文件时（处在第一行和文件之间），返回 -1。

fileinput.lineno()：返回已被读取的累计行号。

—>在第一行被读取之前，返回 0。在最后一个文件的最后一行被读取之后，返回该行的行号。

fileinput.filelineno()：返回当前文件中的行号。

—>在第一行被读取之前，返回 0。

—>在最后一个文件的最后一行被读取之后，返回此文件中该行的行号。

2.1.2 进阶用法

fileinput.isfirstline()：如果刚读取的行是其所在文件的第一行则返回 True，否则返回 False。

fileinput.isstdin()：如果最后读取的行来自 sys.stdin 则返回 True，否则返回 False。

fileinput.nextfile()：关闭当前文件以使下次迭代将从下一个文件（如果存在）读取第一行；不是从该文件读取的行将不会被计入累计行数。直到下一个文件的第一行被读取之后文件名才会改变。

—>在第一行被读取之前，此函数将不会生效；它不能被用来跳过第一个文件。

—>在最后一个文件的最后一行被读取之后，此函数将不再生效。

fileinput.close()：关闭序列。

2.2 默认读取

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput

'当 Python 脚本没有传入任何参数时，fileinput 默认会以 stdin 作为输入源'
for line in fileinput.input():
    print(f'{line}')

运行结果

你输入的内容，程序都会读取并再输出。

俗称：复读机

2.3 处理一个文件

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('output.txt',)) as file:
    for line in file:
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行：{line}',end='')

运行结果

解析：

fileinput 有且仅有这两种读取模式：‘r’，‘rb’;

fileinput.input() 默认使用 mode=‘r’ 的模式读取文件，如果你的文件是二进制的，可以使用mode=‘rb’ 模式。

2.4 处理批量文件

2.4.1 多文件序号连续排序

调用方法

fileinput.lineno()方法

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('output.txt','input.txt')) as file:
    for line in file:
        #fileinput.lineno() 把两个文件的整合陈一个文件对象file，需要排序输出
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')

        # fileinput.filelineno()两个文件单独读取，需要单独排序
        print(f'{fileinput.filename()} 第{fileinput.filelineno()}行: {line}', end='')

运行结果

2.4.2 多文件序号单独排序

调用方法

fileinput.filelineno()方法

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput

'files 输入打开文件的名称即可'
with fileinput.input(files=('test1.txt','test2.txt')) as file:
    for line in file:
        # fileinput.filelineno()两个文件单独读取，需要单独排序
        print(f'{fileinput.filename()} 第{fileinput.filelineno()}行: {line}', end='')

运行结果

2.4.3 与glob配合用法

在颜值的时代，上面的输出样式，已经无法满足我们的需要了，

于是乎，我们就想到了glob。

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput
import glob

#glob 匹配te开头的txt文件
for line in fileinput.input(glob.glob("te*.txt")):
    if fileinput.isfirstline():
        #输出读取文件
        print('='*10,f'读取文件{fileinput.filename()}','='*10)
        #fileinput.filelineno()方法读取
    print(str(fileinput.filelineno())+ ':'+line.upper(),end='')

运行结果

就这颜值，哪个小姐姐能不喜欢呢。

2.5 读取与备份

调用方法

fileinput.input 的backup 参数，可以指定备份的后缀名，比如 .bak

代码示例

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput

#触发backup的动作，源文件内容被修改，对源文件进行backup
with fileinput.input(files=("test1.txt",), backup=".bak",inplace=1) as file:
    for line in file:
        print(line.rstrip().replace('111111', '222222'))
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')

运行结果

2.5 重定向替换

解析

上面的例子，用到了 inplace参数，表示是否将标准输出的结果写回文件，默认不取代

代码示例：

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput

#触发backup的动作，源文件内容被修改，对源文件进行backup
with fileinput.input(files=("test2.txt",), inplace=True) as file:
    print("[INFO] task is started...")
    for line in file:
        print(f'{fileinput.filename()} 第{fileinput.lineno()}行: {line}', end='')
    print("[INFO] task is closed...")

运行结果

注

通过运行结果，可以看到：

- 在 for 循环体内的 print 内容会写回到原文件中了。

- 而在 for 循环体外的 print 则没有变化。

2.6 进阶

2.6.1 openhook含义解析

在 fileinput.input() 中有一个 openhook 的参数，它支持用户传入自定义的对象读取方法；

-如果没有传入任何勾子，fileinput 默认使用的是 open 函数；

2.6.2 方法介绍

fileinput 内置了两种勾子

1、fileinput.hook_compressed(filename, mode)

使用 gzip 和 bz2 模块透明地打开 gzip 和 bzip2 压缩的文件（通过扩展名 ‘.gz’ 和 ‘.bz2’ 来识别）；

如果文件扩展名不是 ‘.gz’ 或 ‘.bz2’，文件会以正常方式打开（即使用 open() 并且不带任何解压操作）；

使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_compressed)

2、fileinput.hook_encoded(encoding, errors=None)

返回一个通过 open() 打开每个文件的钩子，使用给定的 encoding 和 errors 来读取文件。

使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_encoded(“utf-8”, “surrogateescape”))

2.6.3 示例实战

假如我想要使用 fileinput 来读取网络上的文件，思路：

先使用 requests 下载文件到本地

再使用 open 去读取它；

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

def online_open(url, mode):
    import requests
    r = requests.get(url)
    filename = url.split("/")[-1]
    with open(filename,'w') as f1:
        f1.write(r.content.decode("utf-8"))
    f2 = open(filename,'r')
    return f2

直接将这个函数传给 openhook 即可：

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ

import fileinput
file_url = 'https://www.csdn.net/robots.txt'
with fileinput.input(files=(file_url,), openhook=online_open) as file:
    for line in file:
        print(line, end="")

代码整合：

# -*- coding:utf-8 -*-
# @Time   : 2022-07-23
# @Author : carl_DJ
def online_open(url, mode):
    import requests
    r = requests.get(url)
    filename = url.split("/")[-1]
    with open(filename,'w') as f1:
        f1.write(r.content.decode("utf-8"))
    f2 = open(filename,'r')
    return f2

import fileinput
file_url = 'https://www.csdn.net/robots.txt'
with fileinput.input(files=(file_url,), openhook=online_open) as file:
    for line in file:
        print(line, end="")

运行结果

3、总结

看到这里，今天的分享差不多就要结束了。

关于fileinput的介绍，也就介绍到这里。

fileinput本身是对 open 函数的再次封装，所以在读取的部分，就比open显得更专业，更优雅，这也是仅限于读取的方面。

在写的方面，相对于open，就不是那么的强悍。

归根结底，fileinput还是一个不错的方法。值得你拥有。

到此这篇关于Python3读取文件的操作详解的文章就介绍到这了,更多相关Python3读取文件内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

Python3读取文件常用方法实例分析

本文实例讲述了Python3读取文件常用方法.分享给大家供大家参考.具体如下: ''''' Created on Dec 17, 2012 读取文件 @author: liury_lab ''' # 最方便的方法是一次性读取文件中的所有内容放到一个大字符串中: all_the_text = open('d:/text.txt').read() print(all_the_text) all_the_data = open('d:/data.txt', 'rb').read() print(all
Python3 tkinter 实现文件读取及保存功能

tkinter介绍 tkinter是python自带的GUI库,是对图形库TK的封装 tkinter是一个跨平台的GUI库,开发的程序可以在win,linux或者mac下运行 # !/user/bin/env Python3 # -*- coding:utf-8 -*- """ file:window.py.py create time:2019/6/27 14:54 author:Loong Xu desc: 窗口 """ import tki
Python3 读取Word文件方式

我的环境,Windows10,Python3.6.3 查询了很多有关资料,发现都是Python2版本操作Word文件的,所以就写了这篇短小的文章. 一.安装 docx pip install docx 完了之后,导入:import docx 发现报错:ModuleNotFoundError: No module named 'exceptions' 说没有 exceptions 这个模块,由于Python3已经取消了这个模块,而 PendingDeprecationWarning 是内置可以直
python3读取csv和xlsx文件的实例

基于win10系统,python3.6 读取csv 使用csv函数包,安装 pip install csv 使用方法: import csv def fileload(filename = '待读取.csv'): csvfile = open(filename, encoding = 'utf-8') data = csv.reader(csvfile) dataset = [] for line in data: dataset.append(line) csvfile.close() ret
python3读取文件指定行的三种方法

行遍历实现在python中如果要将一个文件完全加载到内存中,通过file.readlines()即可,但是在文件占用较高时,我们是无法完整的将文件加载到内存中的,这时候就需要用到python的file.readline()进行迭代式的逐行读取: filename = 'hello.txt' with open(filename, 'r') as file: line = file.readline() counts = 1 while line: if counts >= 50000000:
python3读取csv文件任意行列代码实例

这篇文章主要介绍了python3读取csv文件任意行列代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下读取每一行 reader = csv.reader(f) 此时reader返回的值是csv文件中每行的列表,将每行读取的值作为列表返回 #读取每一行 filename='D:\\file_information1.csv' import csv with open(filename,newline = '',encoding = 'ut
Python3读取文件的操作详解

目录 1.引言 2. fileinput 2.1 方法介绍 2.2 默认读取 2.3 处理一个文件 2.4 处理批量文件 2.5 读取与备份 2.5 重定向替换 2.6 进阶 3.总结 1.引言小鱼:小屌丝, 这段代码为什么要开两个线程? 小屌丝:因为我要读写文件,还要备份文件,所以就开两个线程了. 小鱼:嗯,想法是对的,但是,还有一种简便的方法, 不需要开两个线程就能搞得定的. 小屌丝:额…难道是with open? 小鱼:不是. 小屌丝:那还有啥呢? 我咋想不起来了. 小鱼:嗯,这个方法很
Python读取word文本操作详解

本文研究的主要问题时Python读取word文本操作,分享了相关概念和实现代码,具体如下. 一,docx模块 Python可以利用python-docx模块处理word文档,处理方式是面向对象的.也就是说python-docx模块会把word文档,文档中的段落.文本.字体等都看做对象,对对象进行处理就是对word文档的内容处理. 二,相关概念如果需要读取word文档中的文字(一般来说,程序也只需要认识word文档中的文字信息),需要先了解python-docx模块的几个概念. 1,Docume
Pandas对CSV文件读写操作详解

目录什么是 CSV 文件 CSV 库解析 CSV 文件读取 CSV 文件 CSV reader 参数 CSV 文件的写入使用 pandas 库解析 CSV 文件 pandas 读取 CSV 文件 pandas 写入 CSV 文件什么是 CSV 文件 CSV 文件(逗号分隔值文件)是一种纯文本文件,它使用特定的结构来排列表格数据.因为它是一个纯文本文件,所以只能包含实际的文本数据,换句话说就是可打印的 ASCII 或 Unicode 字符. 通常,CSV 文件的结构由其名称给出,使用逗号分
Python读写JSON文件的操作详解

目录 JSON JSON 起源 JSON 样例 Python 原生支持 JSON 序列化 JSON 简单的序列化示例 JSON 反序列化简单的反序列化示例应用案例编码和解码 JSON JSON 起源 JSON 全称 JavaScript Object Notation .是处理对象文字语法的 JavaScript 编程语言的一个子集.JSON 早已成为与语言无关的语言,并作为自己的标准存在. JSON 样例 { "data":[ { "id": "1
Java Zip文件读写操作详解

输入流(读取): ZipInputStream是一种FileInputStream流,它可以直接读取Zip压缩包的内容: ┌───────────────────┐│ InputStream │└───────────────────┘ ▲ │┌───────────────────┐│ FilterInputStream │└───────────────────┘ ▲ │┌──────────────────
对Python3 pyc 文件的使用详解

什么是pyc文件 pyc是一种二进制文件,是由py文件经过编译后,生成的文件,是一种byte code,py文件变成pyc文件后,加载的速度有所提高,而且pyc是一种跨平台的字节码,是由python的虚拟机来执行的,这个是类似于JAVA或者.NET的虚拟机的概念.pyc的内容,是跟python的版本相关的,不同版本编译后的pyc文件是不同的,2.5编译的pyc文件,2.4版本的python是无法执行的. 为什么需要pyc文件这个需求太明显了,因为py文件是可以直接看到源码的,如果你是开发商业软
Go语言学习笔记之文件读写操作详解

目录文件写文件读小结文件操作比较多,分为几篇来写吧.首先是文件的读写,在平时的工程化操作中使用最多. 文件写样例代码如下 package main import ( "bufio" "fmt" "io" "os" ) //写文件 func DoWriteFile() error { _filePath := "./test.txt" _file, _err := os.OpenFile(_file
Java 对 Properties 文件的操作详解及简单实例

Java 对 Properties 文件的操作简介在 Java 中,我们常用 java.util.Properties.Properties 类来解析 Properties 文件,Properties 格式文件是 Java 常用的配置文件,它用来在文件中存储键-值对,其中键和值用等号分隔,格式如下: name=shawearn Properties 类是 java.util.Hashtable<Object, Object> 的子类,用于键和值之间的映射. 在对 Properties 格式
IOS 文件读写操作详解及简单实例

iPhone 文件读写操作 1,写文件操作 - (IBAction)btnWrite:(id)sender { //创建文件管理器 NSFileManager *fileManager = [NSFileManager defaultManager]; //获取路径 //参数要获取的哪种路径 NSArray *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES); NSSt
Java IO读取文件的实例详解

Java中文件流的两个主要方式就是字符流和字节流,如下图: 具体的使用方法可以参考官方文档,这里主要介绍四种常见的文件读取方式 1.通过字节来读取文件(常用于二进制文件:图片.声音.视频等) 2.通过字符来读取文件(常用于文本的读取) 3.通过行来读取文件(常用于面向行的格式化文本读取) 4.随机读取文件(基于字节来读取) 下面是对于这四种读取方式的代码,如下: package com.ds.io; //1.按字节读取文件内容 //2.按字符读取文件内容 //3.按行读取文件内容 //4.随机读