如何用Python提取10000份log中的产品信息
一、背景
协助产品部门提取10000份产品log信息中的SN号、IMEI号、ICCID号到Excel表格中。
1.l原始的og内容:
2.提取后的Excel表格:
二、实现
1.思路
a.for遍历获取所有log文件的路径;
b.for遍历log文件内容;
c.re正则匹配SN号、IMEI号、ICCID号写入Excel表格中。
2.实现代码
#!/usr/bin/python import os,xlsxwriter,re def get_data(): workbook = xlsxwriter.Workbook('Test.xlsx') #建立Excel worksheet = workbook.add_worksheet() #添加sheet worksheet.write('A1', 'SN') #添加列标题 worksheet.write('B1', 'IMEI') worksheet.write('C1', 'ICCID') files=os.listdir(r'E:\T\工位三(PAS LOG)\PASS') #获取目录中所有log名称列表 j= 1 for i in files: #遍历目录中的log文件 xpath = os.path.join('E:\T\工位三(PAS LOG)\PASS',i) #拼接log文件路径 f = open(xpath, 'r',encoding='ISO-8859-1') #打开log文件 result = f.readlines() #读取所有log文件内容 f.close() for line in result: #遍历log文件内容 if re.search('WriteSN:(.*)', line.strip()): #正则匹配 sn=re.search('WriteSN:(.*)',line.strip()).group(1) worksheet.write('A' + str(j + 1), sn) #将匹配到的SN号写入Excel中 print(sn) if re.search('IMEI:(.*)', line.strip()): imei= re.search('IMEI:(.*)', line.strip()).group(1) worksheet.write('B' + str(j + 1), imei) print(imei) if re.search('ICCID:(.*)', line.strip()): iccid =re.search('ICCID:(.*)', line.strip()).group(1) worksheet.write('C' + str(j + 1), iccid) print(iccid) j=j+1 workbook.close() if __name__ == '__main__': get_data()
以上就是如何用Python提取10000份log中的产品信息的详细内容,更多关于python 提取log中的信息的资料请关注我们其它相关文章!
相关推荐
-
Python中logging日志的四个等级和使用
1. logging日志的介绍 在现实生活中,记录日志非常重要,比如:银行转账时会有转账记录:飞机飞行过程中,会有个黑盒子(飞行数据记录器)记录着飞机的飞行过程,那在咱们python程序中想要记录程序在运行时所产生的日志信息,怎么做呢? 可以使用 logging 这个包来完成 记录程序日志信息的目的是: 1. 可以很方便的了解程序的运行情况 2. 可以分析用户的操作行为.喜好等信息 3. 方便开发人员检查bug 2. logging日志级别介绍 日志等级可以分为5个,从低到高分别是: 1. DE
-
python tkinter的消息框模块(messagebox,simpledialog)
tkinter提供了三个模块,可以创建弹出对话窗口:(使用必须单独导入模块) 1.messagebox 消息对话框 示例:askokcancel import tkinter # 导入消息对话框子模块 import tkinter.messagebox # 创建主窗口 root = tkinter.Tk() # 设置窗口大小 root.minsize(300,300) # 声明函数 def okqqq(): # 弹出对话框 result = tkinter.messagebox.askokcan
-
python 利用正则表达式提取特殊信息
1.删除字符串中的 Python注释 案例: import re time = "2020-01-01 # 这是一个日期" num = re.sub(r'#.*$', "", time)#以#为分隔,去掉后面的信息 print("这个时间是:", num) 结果: 这个时间是: 2020-01-01 2.截取某符号前后的内容 案例1: txt = '我的电话是:131-246-XXX19' a = txt.split(':')[0]#0表示符号前
-
python批量提取word内信息
单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的信息打印出来 #coding:utf-8 import os import win32com from win32com.client import Dispatch, constants from docx import Document def parse_doc(f): """读取doc,返回姓名和行业 """ doc
-
Python网络爬虫信息提取mooc代码实例
实例一--爬取页面 import requests url="https//itemjd.com/2646846.html" try: r=requests.get(url) r.raise_for_status() r.encoding=r.apparent_encoding print(r.text[:1000]) except: print("爬取失败") 正常页面爬取 实例二--爬取页面 import requests url="https://w
-
python 日志模块logging的使用场景及示例
前言 日志是对于软件执行所发生的事件的一种追踪记录方式.日常使用过程中对代码执行的错误和问题会进行查看日志来分析定位问题所在.平常编写代码以及调试也经常用到.通常的新手的做法是直接print打印,但是打印的结果只在控制台显示.今天我们学习一种高级的日志打印和记录模块logging. logging提供了一系列的函数,它们是debug(), info(), warning(), error(), 和critical(). 他们的使用场景请看下表 你想要执行的任务 此任务的最好的工具 对于命令行或程
-
Python网络爬虫与信息提取(实例讲解)
课程体系结构: 1.Requests框架:自动爬取HTML页面与自动网络请求提交 2.robots.txt:网络爬虫排除标准 3.BeautifulSoup框架:解析HTML页面 4.Re框架:正则框架,提取页面关键信息 5.Scrapy框架:网络爬虫原理介绍,专业爬虫框架介绍 理念:The Website is the API ... Python语言常用的IDE工具 文本工具类IDE: IDLE.Notepad++.Sublime Text.Vim & Emacs.Atom.Komodo E
-
python读取raw binary图片并提取统计信息的实例
用python语言读取二进制图片文件,并提取非零数据统计信息(例如:max,min,skewness and kurtosis) python新手,注释较少,欢迎指教 import struct import math import numpy import scipy.stats filename = input('enter file name') f = open(filename, 'rb') f.seek(0, 0) c = 0 numOfZero = 0 s = 0 num = []
-
python提取照片坐标信息的实例代码
python提取照片坐标信息的代码如下所示: from PIL import Image from PIL.ExifTags import TAGS import os output="Z://result.csv" out=open(output,'a') out.write('lat,lon\n') fpath="Z://iphonephoto" for item in os.walk(fpath): ob=item[2] for i in ob: name=f
-
如何用Python提取10000份log中的产品信息
一.背景 协助产品部门提取10000份产品log信息中的SN号.IMEI号.ICCID号到Excel表格中. 1.l原始的og内容: 2.提取后的Excel表格: 二.实现 1.思路 a.for遍历获取所有log文件的路径: b.for遍历log文件内容: c.re正则匹配SN号.IMEI号.ICCID号写入Excel表格中. 2.实现代码 #!/usr/bin/python import os,xlsxwriter,re def get_data(): workbook = xlsxwrite
-
python 提取tuple类型值中json格式的key值方法
标题比较麻烦,都有些叙述不清:昨天下午在调试接口框架的时候,遇到了一个问题是这样的: 使用python 写了一个函数,return 了两个返回值比如 return a,b 于是返回的a,b 是tuple类型,比如值是actual.那么,得到a,b分别是actual[0] ,actual[1]这样的.而目前,actual[0]的值是这样的: {"code":"m0001","result":True} ,但是我想得到code的key值 m0001
-
如何用 Python 子进程关闭 Excel 自动化中的弹窗
利用Python进行Excel自动化操作的过程中,尤其是涉及VBA时,可能遇到消息框/弹窗(MsgBox).此时需要人为响应,否则代码卡死直至超时 [^1] [^2].根本的解决方法是VBA代码中不要出现类似弹窗,但有时我们无权修改被操作的Excel文件,例如这是我们进行自动化测试的对象.所以本文记录从代码角度解决此类问题的方法. 假想场景 使用xlwings(或者其他自动化库)打开Excel文件test.xlsm,读取Sheet1!A1单元格内容.很简单的一个操作: import xlwing
-
使用Python提取文本中含有特定字符串的方法示例
今天搞了一天的文本处理,发现python真的太适合做数据处理了.废话不多说,一起学习吧! 1.我的原始数据是这样的,如图 2.如果要提取每行含有pass的字符串,代码如下: import re filepath = "E:/untitled1/analyze_log/test.log" txt = open(filepath, "r").read() result="" test_text = re.findall(".........
-
详解分布式系统中如何用python实现Paxos
一致性算法背景 1.Paxos一致性算法解决的问题:分布式系统中数据不能存在单个节点(主机)上,否则可能出现单点故障:多个节点(主机)需要保证具有相同的数据. 2.什么是一致性:一致性就是数据保持一致,在分布式系统中,可以理解为多个节点中数据的值是一致的. 3.一致性模型分类:一般分为强一致性和弱一致性,强一致性保证系统改变提交以后立即改变集群的状态.常见模型包括:Paxos,Raft(muti-paxos),ZAB(muti-paxos): 弱一致性也叫最终一致性,系统不保证改变提交以后立即改
-
如何用python清洗文件中的数据
目录 使用filter 清洗数据同时记录订单号并排序 简单版 直接打开日志文件,往另外一个文件中按照要过滤的要求进行过滤 import io; with open('a.txt', 'w') as f: for line in open('c:/201509.txt'): if line.find('更改项目')>0 and line.find('500')>0: f.write(line+"\n"); print("输出完成"); 注意.find返回的
-
Python提取Word中图片的实现步骤
目录 1.思路 2.具体实现 2.1导入相关库 2.2定义函数 2.3重命名word文件,将后缀名docx改为zip 2.4zip还原为docx文件,并获得图片的列表 2.5将图片复制到需要保存的文件夹中 2.6删除tmp缓冲文件夹中的文件,用以存储下一次的文件 2.7运行程序 3效果预览 3.1源word 3.2提取的图片 4附:doc转docx 1.思路 在网上查找了半天,基本都是提取word中文字的,没有找到可以把word中的图片提取出来的方法.一个巧合的情况下,发现将word的后缀名改为
-
Python编程实现从字典中提取子集的方法分析
本文实例讲述了Python编程实现从字典中提取子集的方法.分享给大家供大家参考,具体如下: 首先我们会想到使用字典推导式(dictionary comprehension)来解决这个问题,例如以下场景: prices={'ACME':45.23,'APPLE':666,'IBM':343,'HPQ':33,'FB':10} #选出价格大于 200 的 gt200={key:value for key,value in prices.items() if value > 200} print(gt
-
python实现从pdf文件中提取文本,并自动翻译的方法
针对Python 3.5.2 测试 首先安装两个包: $ pip install googletrans $ pip install pdfminer3k googletrans会提供一个命令translate,这个命令会调用google translate api执行自动翻译: pdfminer3k会提供一个工具脚本pdf2txt.py: $ pdf2txt.py xxx.pdf 从stackoverflow搜索到可以去除页眉和页脚的命令(强烈推荐): 使用Ubuntu提供的pdftotext
-
python实现提取str字符串/json中多级目录下的某个值
字符串多级目录取值: 比如说: 你response接收到的数据是这样的. 你现在只需要取到itemstring 这个字段下的值.其他的都不要! 思路就是:字符串是个json格式(或转为json格式),然后str转为字典dict,然后循环遍历按照key来取值. 你的data是个字典 然后item_list是data的Key ,item_list是个数组,这个里面的数组中的每个元素都是一个字典. 因此就是dict多级路径按key取值. # 多级目录提取-dict print(type(respons
随机推荐
- 程序开发中的几个请不要相信
- Ionic + Angular.js实现图片轮播的方法示例
- 关闭端口防止病毒与黑客入侵的设置方法
- Oracle中instr函数使用方法
- js中的this关键字详解
- java开发微信公众号支付
- 从零开始学YII2框架(二)通过 Composer 安装扩展插件
- 解析Android资源文件及他们的读取方法详解
- PHP中Session引起的脚本阻塞问题解决办法
- javascript 解析url的search方法
- Android自定义TextView实现drawableLeft内容居中
- jQuery控制cookie过期时间的方法
- 6G数据库的导入 报各种错误的解决办法
- jQuery 性能优化指南 (1)
- 微信企业号开发之微信考勤Cookies的使用
- 一条一条新闻向上的滚动 不错
- javascript小数精度丢失的完美解决方法
- 关于PHP中的Class的几点个人看法
- Android 提交或者上传数据时的dialog弹框动画效果
- Android后台模拟点击探索(附源码)