python 实时遍历日志文件
open 遍历一个大日志文件
使用 readlines() 还是 readline() ?
总体上 readlines() 不慢于python 一次次调用 readline(),因为前者的循环在C语言层面,而使用readline() 的循环是在Python语言层面。
但是 readlines() 会一次性把全部数据读到内存中,内存占用率会过高,readline() 每次只读一行,对于读取 大文件, 需要做出取舍。
如果不需要使用 seek() 定位偏移, for line in open('file') 速度更佳。
使用 readlines(),适合量级较小的日志文件
import os import time def check(): p = while True: f = open("log.txt", "r+") f = open("result.txt", "a+") f.seek(p, ) #readlines()方法 filelist = f.readlines() if filelist: for line in filelist: #对行内容进行操作 f.write(line) #获取当前位置,为下次while循环做偏移 p = f.tell() print 'now p ', p f.close() f.close() time.sleep() if __name__ == '__main__': check()
使用 readline(),避免内存占用率过大
import os import time def check(): p = while True: f = open("log.txt", "r+") f = open("result.txt", "a+") f.seek(p, ) #while readline()方法 while True: l = f.readline() #空行同样为真 if l: #对行内容操作 f.write(l) else: #获取当前位置,作为偏移值 p = f.tell() f.close() f.close() break print 'now p', p time.sleep() if __name__ == '__main__': check()
相关推荐
-
python 从远程服务器下载日志文件的程序
复制代码 代码如下: import osimport sysimport ftplibimport socket ################################################################### sign in the ftp server and download the log file. # 登陆生产服务器下载日志##############################################################
-
python解析基于xml格式的日志文件
大家中午好,由于过年一直还没回到状态,好久没分享一波小知识了,今天,继续给大家分享一波Python解析日志的小脚本. 首先,同样的先看看日志是个啥样. 都是xml格式的,是不是看着就头晕了??没事,我们先来分析一波. 1.每一段开头都是catalina-exec,那么我们就按catalina-exec来分,分了之后,他们就都是一段一段的了. 2.然后,我们再在已经分好的一段段里面分,找出你要分割的关键字,因为是xml的,所以,接下来的工作就简单了,都是一个头一个尾的. 3.但是还有一个问题,有可
-
python实现分析apache和nginx日志文件并输出访客ip列表的方法
本文实例讲述了python实现分析apache和nginx日志文件并输出访客ip列表的方法.分享给大家供大家参考.具体如下: 这里使用python分析apache和nginx日志文件输出访客ip列表 ips = {} fh = open("/var/log/nginx/access.log", "r").readlines() for line in fh: ip = line.split(" ")[0] if 6 < len(ip) &l
-
python脚本实现统计日志文件中的ip访问次数代码分享
适用的日志格式: 106.45.185.214 - - [06/Aug/2014:07:38:59 +0800] "GET / HTTP/1.0" 200 10 "-" "-" 171.104.119.22 - - [06/Aug/2014:08:55:01 +0800] "GET / HTTP/1.0" 200 10 "-" "-" 27.31.238.242 - - [06/Aug/
-
Python解析nginx日志文件
项目的一个需求是解析nginx的日志文件. 简单的整理如下: 日志规则描述 首先要明确自己的Nginx的日志格式,这里采用默认Nginx日志格式: log_format main '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_f
-
python 实时遍历日志文件
open 遍历一个大日志文件 使用 readlines() 还是 readline() ? 总体上 readlines() 不慢于python 一次次调用 readline(),因为前者的循环在C语言层面,而使用readline() 的循环是在Python语言层面. 但是 readlines() 会一次性把全部数据读到内存中,内存占用率会过高,readline() 每次只读一行,对于读取 大文件, 需要做出取舍. 如果不需要使用 seek() 定位偏移, for line in open('fi
-
Java实时监控日志文件并输出的方法详解
前言 最近有一个银行数据漂白系统,要求操作人员在页面调用远端Linux服务器的shell,并将shell输出的信息保存到一个日志文件,前台页面要实时显示日志文件的内容.这个问题难点在于如何判断哪些数据是新增加的,通过查看JDK 的帮助文档, java.io.RandomAccessFile可以解决这个问题.为了模拟这个问题,编写LogSvr和 LogView类,LogSvr不断向mock.log日志文件写数据,而 LogView则实时输出日志变化部分的数据. 代码1:日志产生类 package
-
python处理大日志文件
本文实例为大家分享了python处理大日志文件的具体代码,供大家参考,具体内容如下 # coding=utf-8 import sys import time class Tail(): def __init__(self,file_name,callback=sys.stdout.write): self.file_name = file_name self.callback = callback def follow(self,n=10): try: # 打开文件 with open(sel
-
基于python实现cdn日志文件导入mysql进行分析
目录 一.本文需求背景 二.需求落地如下 三.自定义查询 一.本文需求背景 周六日出现CDN大量请求,现需要分析其请求频次与来源,查询是否存在被攻击问题. 本文以阿里云CDN日志作为辅助查询数据,其它云平台大同小异. 系统提供的离线日志如下所示: 二.需求落地如下 日志实例如下所示: [9/Jun/2015:01:58:09 +0800] 10.10.10.10 - 1542 "-" "GET http://www.aliyun.com/index.html" 20
-
Python实现遍历读取文件或文件夹
目录 例子 os.listdir os.walk 遍历读取代码 搞机器学习或者深度学习算法很多时候需要遍历某个目录读取文件,特别是经常需要读取某个特定后缀的文件,比如图片的话可能需要读取jpg, png, bmp格式的文件.python本身的库函数功能没有这么定制化,所以就需要再重新包装一下. 例子 假设我们有如下的目录结构,以bmp结尾的是文件,其他是文件夹.下面的程序都将以该目录结构为例进行说明. os.listdir os.listdir仅读取当前路径下的文件和文件夹,返回一个列表.读取d
-
Python 写入训练日志文件并控制台输出解析
1. 背景 在深度学习的任务中,通常需要比较长时间的训练,因此我们会选择离开电脑.笔者在跟踪模型表现, 观察模型accuracy 以及 loss 的时候,比较传统的方法是在控制台print输出或者直接使用tensorboard. 但如果是你需要远程观察模型表现,那一个时刻记录的log 文件就非常重要. (如果你希望不在实验室,远程通过访问正在训练网络的服务器的Jupyter Notebook ,实时查看实验进度.请参考--远程连接服务器端Jupyter Notebook) 2. logging
-
利用python分析access日志的方法
前言 WAF上线之后,处理最多的是误报消除. 产生误报有多种原因,比如web应用源码编写时允许客户端提交过多的cookie:比如单个参数提交的数值太大. 把误报降低到了可接受的范围后,还要关注漏报.WAF不是神,任何WAF都可能被绕过.所以还需要定位漏过的攻击,明确漏报的原因,才能update WAF的策略. 要定位漏报,就必须分析Web应用的访问日志了.一个站点,每天产生的access日志大概接近1GB,显然靠肉眼看是不现实的.这就需要用python帮助自动分析. 实现思路 拿我司某Web系统
-
python 实现创建文件夹和创建日志文件的方法
一.实现创建文件夹和日志 #!/usr/bin/env python # -*- coding:utf-8 -*- # Author: nulige import os import datetime #获取系统时间 log_path_suffix = datetime.datetime.now().strftime('%Y-%m-%d ') #创建文件夹 folder_name = '\log' root_directory = 'D:\python\disk_monitor' try: os
-
python实时监控logstash日志代码
实时读取logstash日志,有异常错误keywork即触发报警. # /usr/bin/env python3 # -*- coding: utf-8 -*- # __author__ = caozhi # create_time 2018-11-12,update_time 2018-11-15 # version = 1.0 # 录像高可用报警 # 1 读取日志 使用游标移动 # 2 线上业务日志文件会切割,切割后,读取上一个切割的日志 import os import sys impor
随机推荐
- PHP 图片水印类代码
- iview给radio按钮组件加点击事件的实例
- AngularJS利用Controller完成URL跳转
- Angular 2 ngForm中的ngModel、[ngModel]和[(ngModel)]的写法
- Flex Bindable 的用法
- vbs实现的汉字转拼音的函数
- 正则表达式匹配 非XXX的行
- iOS项目开发--实现类似淘宝详情页面
- 用NODE.JS中的流编写工具是要注意的事项
- js判断设备是否为PC并调整图片大小
- 常用JavaScript代码提示公共类封装
- 模板引擎正则表达式调试小技巧
- python多线程编程中的join函数使用心得
- C#通过WIN32 API实现嵌入程序窗体
- vbs 字符统计功能模块
- MySQL中用户授权以及删除授权的方法
- CentOS系统上安装配置Oracle数据库的详细教程
- JQuery中$.each 和$(selector).each()的区别详解
- Android 6.0开发实现关机菜单添加重启按钮的方法
- Android ReboundScrollView仿IOS拖拽回弹效果