python numpy实现多次循环读取文件等间隔过滤数据示例

2026-04-21 04:04:15

numpy的np.fromfile会出现如下的问题，只能一次性读取文件的内容，不能追加读取，连续两次的np.fromfile读到的东西一样

如果数据文件太大（几个G或以上）不能一次性全读进去，需要追加读取

而我希望读到的donser1和donser2是连续的两段

（实际使用时，比如说读取的文件是二进制数据文件，每一块文件都包括包头+数据，希望将这两块分开获取，然后再做进一步处理）

代码：

import numpy as np

length=2500
plt_arr=np.linspace(0.0, 0.0, length*2048*16)
start=0
tail_size = 40  #40bit
num_size=16*1024-40 # 16kb -40b

def one_file(f, loop):
  global tail_size, num_size
  while loop:
    num = np.fromfile(f, dtype=np.int16, count=num_size)
    tail=np.fromfile(f, dtype=np.int16, count=tail_size)
    loop=loop-1
    yield num, tail

def main():
  file_path="E://1-gl300c.r3f"
  global length, plt_arr, start
  loop=length
  with open(file_path, 'rb') as f:
    for num, tail in one_file(f, loop):
      plt_arr[start:start+len(num)]=num[:]
      start=start+len(num)
  return   plt_arr[0:start]

if __name__ == "__main__":
  donser=main()
  print(donser)

假设数据文件的格式是数据+包尾，plt_arr存储全部的数据部分，包尾丢弃，该方法实现了多次连续追加读取数据文件的内容plt_arr最好使用先开好大小再逐次赋值，亲测append方法和concatenate方法时间效率极差或者不用numpy也可以，代码：

def read_in_chunks(filePath, chunk_size=16*1024):
  file_object = open(filePath,'rb')
  count=0
  while True:
    chunk_data = file_object.read(chunk_size)
    if not chunk_data:
      break
    yield chunk_data[0:16*1024-28]

if __name__ == "__main__":
  num=0
  for chunk in read_in_chunks("E:\\1-gl300c.r3f"):
    #process(chunk) # <do something with chunk>
    name=str(num)+".bin"
    num=num+1
    if num<303000:
      continue
    if num>308001:
      break
    file_object = open(name, 'wb')
    file_object.write(chunk)
    file_object.close( )

numpy.fromfile的其他方法可以参考这个

补充知识：python每隔一段时间运行一个函数

用python语言每隔两分钟从接口获取一次数据来插入到数据库

看了大佬们的方法感觉最简单就是：

做一个死循环，让函数执行完后休眠两分钟，然后进入下一次执行，除非手动停止或者有错误停止，否则程序会永远运行下去。

以下是代码：

import get_details
import time

second=2*60
print second
while True:
get_details.sign_cycle()
time.sleep(second)

上面的代码就是让get_details模块的sign_cycle()函数每两分钟执行一次。

是不是超简单！！！！！！

以上这篇python numpy实现多次循环读取文件等间隔过滤数据示例就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

使用python读取.text文件特定行的数据方法

如何用python循环读取下面.txt文件中,用红括号标出来的数据呢? 首先,观察数据可知,不同行的第一个数据元素不一样,所以考虑直接用正则表达式. 再加上,对读和写文件的操作,就行了注:我用的是pycharm+python2.7 话不多说,直接上代码 import re f1=file('shen.txt','r') data1=f1.readlines() # print data1 f1.close() results = [] for line in data1: data2=line
详解pandas如何去掉、过滤数据集中的某些值或者某些行？

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值.具体来说,看看下面的例子. 0.导入我们需要使用的包 import pandas as pd pandas是很常用的数据分析,数据处理的包.anaconda已经有这个包了,纯净版python的可以自行pip安装. 1.去掉某些具体值数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本.如何做?非常简单. import pandas as pd df[(True-df['appPlatfor
python读取各种文件数据方法解析

python读取.txt(.log)文件 ..xml 文件 .excel文件数据,并将数据类型转换为需要的类型,添加到list中详解 1.读取文本文件数据(.txt结尾的文件)或日志文件(.log结尾的文件) 以下是文件中的内容,文件名为data.txt(与data.log内容相同),且处理方式相同,调用时改个名称就可以了: 以下是python实现代码: # -*- coding:gb2312 -*- import json def read_txt_high(filename): with o
python numpy实现多次循环读取文件等间隔过滤数据示例

numpy的np.fromfile会出现如下的问题,只能一次性读取文件的内容,不能追加读取,连续两次的np.fromfile读到的东西一样如果数据文件太大(几个G或以上)不能一次性全读进去,需要追加读取而我希望读到的donser1和donser2是连续的两段 (实际使用时,比如说读取的文件是二进制数据文件,每一块文件都包括包头+数据,希望将这两块分开获取,然后再做进一步处理) 代码: import numpy as np length=2500 plt_arr=np.linspace(0.0
利用Shell脚本循环读取文件中每一行的方法详解

前言本文主要给大家介绍了关于使用Shell脚本循环读取文件每一行的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 一.使用for循环 for line in `cat filename` do echo $line done 或者 for line in $(cat filename) do echo $line done 二.使用while循环 while read -r line do echo $line done < filename While循环中rea
python使用fileinput模块实现逐行读取文件的方法

本文实例讲述了python使用fileinput模块实现逐行读取文件的方法.分享给大家供大家参考.具体实现方法如下: #-------------------------------- # Name: read_lines.py # Author: Kevin Harris # Last Modified: 02/13/04 # Description: This Python script demonstrates # how to use fileinput to read # each l
python跳过第一行快速读取文件内容的实例

Python编程时,经常需要跳过第一行读取文件内容.简单的做法是为每行设置一个line_num,然后判断line_num是否为1,如果不等于1,则进行读取操作. 相应的Python代码如下: input_file = open("C:\\Python34\\test.csv") line_num = 0 for line in input_file: line_num += 1 if (line_num != 1): do_readline() 然而这样每次迭代都需要判断一次,增加了时
Python read函数按字节(字符)读取文件的实现

文件对象提供了 read() 方法来按字节或字符读取文件内容,到底是读取宇节还是字符,则取决于是否使用了 b 模式,如果使用了 b 模式,则每次读取一个字节:如果没有使用 b 模式,则每次读取一个字符.在调用该方法时可传入一个整数作为参数,用于指定最多读取多少个字节或宇符. 例如,如下程序采用循环读取整个文件的内容: f = open("read_test.py", 'r', True) while True: # 每次读取一个字符 ch = f.read(1) # 如果没有读到数据,
Python中条件语句、循环语句和pass语句的使用示例

目录一.条件语句 1.if……else……语句 1)单分支 2)双分支 2.if……elif……else语句 3.多重if嵌套二.循环语句 1.for循环 2.while循环三.pass语句总结一.条件语句条件语句能够改变Python程序的执行流程,是执行这个代码块还是另一个代码块.凡是需要判断来确定下一步如何执行的程序都要使用条件语句. 一般条件语句有 1.if……else…… 2.if……elif……else 3.多重if嵌套 1.if……else……语句 1)单分支单分支实际
C#使用FileStream循环读取大文件数据的方法示例

本文实例讲述了C#使用FileStream循环读取大文件数据的方法.分享给大家供大家参考,具体如下: 今天学习了FileStream的用法,用来读取文件流,教程上都是读取小文件,一次性读取,但是如果遇到大文件,那么我们就需要循环读取文件. 直接上代码. 引用命名空间 using System.IO; 下面就是循环读取大文件的代码 class Program { static void Main(string[] args) { //循环读取大文本文件 FileStream fsRead; //获
分析Python读取文件时的路径问题

Python在读取文件内容时的路径问题,值得深究一下.我想讨论的重点还是在绝对路径上面.在这之前我们先看一下 1:相对路径这张图演示了在相对路径下寻找查找指定文件. open('相对路径演示'\'相对路径示例'.txt)打开的是相对当前运行的程序所在目录. 而我当前运行的程序相对位置在桌面. 所以直接print(lines) 可以看到这个结果 2:绝对路径. 绝对路径的查找方法就不演示了,相信每个人都会找到.但是我想讨论的是几个关于路径中的编码问题,相信这对初学者们有很大的帮助. 2.1:你
Python readline()和readlines()函数实现按行读取文件

目录 Python readline()函数 Python readlines()函数如果想读取用 open() 函数打开的文件中的内容,除了可以使用 read() 函数,还可以使用 readline() 和 readlines() 函数. 和 read() 函数不同,这 2 个函数都以“行”作为读取单位,即每次都读取目标文件中的一行.对于读取以文本格式打开的文件,读取一行很好理解:对于读取以二进制格式打开的文件,它们会以“\n”作为读取一行的标志. Python readline()函数 r
用vbs实现文本循环读取

因为测试中需要读取一批URL数据进行浏览,其实使用QTP本身的table能实现多种读取方式,但是因为需要tabel是使用excel保存的,在没有安装excel的机器或者vsita机器上运行该部分脚本会遇到问题,为了不必要的麻烦,因而使用txt保存网址数据. 但是vbs好像没有提供设置文件读取位置的函数(python提供),网上没有找到这块可用的代码,可能大家基本没有我这么低级的需求吧囧rz--,后来还是搞定了,所以将代码贴出来,以作备忘.其实核心就是发现读取到文本的最后一行,那么重新打开该文件即

python numpy实现多次循环读取文件 等间隔过滤数据示例

相关推荐

随机推荐

python numpy实现多次循环读取文件等间隔过滤数据示例