简单了解Python读取大文件代码实例
这篇文章主要介绍了简单了解Python读取大文件代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
通常对于大文件读取及处理,不可能直接加载到内存中,因此进行分批次小量读取及处理
I、第一种读取方式
一行一行的读取,速度较慢
def read_line(path): with open(path, 'r', encoding='utf-8') as fout: line = fout.readline() while line: line = fout.readline() print(line)
II、第二种读取方式
设置每次读取大小,从而完成多行快速读取
def read_size(path): with open(path, "r", encoding='utf-8') as fout: while 1: buffer = fout.read(8 * 1024 * 1024) if not buffer: break print(buffer)
III、第三种读取方式
使用itertools模块,islice返回的是一个生成器,可以用list格式化
from itertools import islice def read_itertools(path): with open(path, 'r', encoding='utf-8') as fout: list_gen = islice(fout, 0, 5) # 两个参数分别表示开始行和结束行 for line in list_gen: print(line)
完成
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。
相关推荐
-
python实现读取大文件并逐行写入另外一个文件
<pre name="code" class="python">creazy.txt文件有4G,逐行读取其内容并写入monday.txt文件里. def creazyRead(): ''''' with open("e:creazy.txt","r") as cr: for line in cr: print line ''' ms = open("e:creazy.txt") for line
-
python读取大文件越来越慢的原因与解决
背景: 今天同事写代码,用python读取一个四五百兆的文件,然后做一串逻辑上很直观的处理.结果处理了一天还没有出来结果.问题出在哪里呢? 解决: 1. 同事打印了在不同时间点的时间,在需要的地方插入如下代码: print time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) 发现一个规律,执行速度到后面时间越来越长,也就是处理速度越来越慢. 2. 为什么会越来越慢呢? 1)可能原因1,GC 的问题,有篇文章里面写,pyth
-
python简单读取大文件的方法
本文实例讲述了python简单读取大文件的方法.分享给大家供大家参考,具体如下: Python读取大文件(GB级别)采用的办法很简单: with open(...) as f: for line in f: <do something with line> 例如: with open(filepath,'r') as infile: for line in infile: print line 一切都交给python解释器处理,读取效率很高,且占用资源少. stackoverflow参考链接:
-
Python多进程分块读取超大文件的方法
本文实例讲述了Python多进程分块读取超大文件的方法.分享给大家供大家参考,具体如下: 读取超大的文本文件,使用多进程分块读取,将每一块单独输出成文件 # -*- coding: GBK -*- import urlparse import datetime import os from multiprocessing import Process,Queue,Array,RLock """ 多进程分块读取文件 """ WORKERS = 4
-
强悍的Python读取大文件的解决方案
Python 环境下文件的读取问题,请参见拙文 Python基础之文件读取的讲解 这是一道著名的 Python 面试题,考察的问题是,Python 读取大文件和一般规模的文件时的区别,也即哪些接口不适合读取大文件. 1. read() 接口的问题 f = open(filename, 'rb') f.read() 我们来读取 1 个 nginx 的日至文件,规模为 3Gb 大小.read() 方法执行的操作,是一次性全部读入内存,显然会造成: MemoryError ... 也即会发生内存溢出.
-
使用Python读取大文件的方法
背景 最近处理文本文档时(文件约2GB大小),出现memoryError错误和文件读取太慢的问题,后来找到了两种比较快Large File Reading 的方法,本文将介绍这两种读取方法. 准备工作 我们谈到"文本处理"时,我们通常是指处理的内容.Python 将文本文件的内容读入可以操作的字符串变量非常容易.文件对象提供了三个"读"方法: .read()..readline() 和 .readlines().每种方法可以接受一个变量以限制每次读取的数据量,但它们
-
Python按行读取文件的实现方法【小文件和大文件读取】
本文实例讲述了Python按行读取文件的实现方法.分享给大家供大家参考,具体如下: 小文件: #coding=utf-8 #author: walker #date: 2013-12-30 #function: 按行读取小文件 all_lines = [] try: file = open('txt.txt', 'r') all_lines = file.readlines() except IOError as err: print('File error: ' + str(err)) fin
-
简单了解Python读取大文件代码实例
这篇文章主要介绍了简单了解Python读取大文件代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 通常对于大文件读取及处理,不可能直接加载到内存中,因此进行分批次小量读取及处理 I.第一种读取方式 一行一行的读取,速度较慢 def read_line(path): with open(path, 'r', encoding='utf-8') as fout: line = fout.readline() while line: line
-
python 搜索大文件的实例代码
如下所示: import os,os.path def getBigFile(pathname,filesize):#第一个参数为要遍历的文件夹,第二个是要找的最小文件的大小 fileList = [] for root,dirs,files in os.walk(pathname):#这里os.walk()遍历目录 for file in files: fname = os.path.abspath(os.path.join(root,file)) if os.path.getsize(fna
-
通过Pandas读取大文件的实例
当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取: import pandas as pd f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv') reader = pd.read_csv(f, sep=',', iterator=True) loop = True chunkSize = 100000 chunks = [] while loop: try: chunk = reader.get_chunk(chunkSize) chun
-
python读取npy文件数据实例
目录 1. 读取与保存 2. 实战案例 附:python中 .npy文件的读写操作实例 总结 Numpy binary files (NPY, NPZ) 注:.npy文件是numpy专用的二进制文件. 1. 读取与保存 import numpy as np arr = np.array([[1, 2, 3], [4, 5, 6]]) np.save('weight.npy', arr) loadData = np.load('weight.npy') print("----type----&qu
-
SpringBoot读取resource文件代码实例
Java标准库中的java.net.URL类和标准处理器对于处理低层的资源没有提供很好的功能.例如,并没有提供一个URL的实现能够从classpath或者ServletContext中读取资源等等.因此,在Spring中提供了这样一个Resource接口,能够更加方便的读取各种资源. 1.使用resourceUtil File file = ResourceUtils.getFile("classpath:config/city.config.json"); 2.注解,注入 publi
随机推荐
- 正则表达式学习问答
- dos 日期时间格式设置使用小结(Date和Time)
- MySQL误操作后快速恢复数据的方法
- CI框架中site_url()和base_url()的区别
- MySQL优化之如何查找SQL效率低的原因
- php pack与unpack 摸板字符字符含义
- 详解iframe与frame的区别
- Android异常 java.lang.IllegalStateException解决方法
- C#实现判断一个时间点是否位于给定时间区间的方法
- 浅谈java中==以及equals方法的用法
- C#利用原图和水印图的重叠简单实现水印的方法
- C++实现多线程查找文件实例
- ES6 迭代器(Iterator)和 for.of循环使用方法学习(总结)
- Linux关机时执行指定脚本功能实现
- 使用element-ui table expand展开行实现手风琴效果
- fastadmin中调用js的方法
- Python考拉兹猜想输出序列代码实践
- Django 反向生成url实例详解
- Golang 中整数转字符串的方法
- 解决Python print输出不换行没空格的问题