python截取两个单词之间的内容方法
1. __init__ 初始化文件路径,关键字1,关键字2;
2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式);
3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件)。
#!/usr/bin/python3 # -*- coding: utf-8 -*- import re #文本所在路径,引号前加r指按路径处理 #关键字word1,word2,换关键字,需修改引号间的内容 class match2Words(object): lines=0 def __init__(self,path,word1,word2): self.path = path self.word1 = word1 self.word2 = word2 def key_match(self): with open(self.path,'rb') as f: buffer = f.read() pattern = re.compile(self.word1+b'(.*?)'+self.word2,re.S) result = pattern.findall(buffer) if result != []: print(result) #self.lines +=1 #print("匹配到的行数:",self.lines) else: print("没有找到你输入的关键字") path = input("请输入要分析的log地址:") word1 = b"begin" word2 = b"end" matchWords = match2Words(path, word1, word2) matchWords.key_match()
以上这篇python截取两个单词之间的内容方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。
相关推荐
-
python将每个单词按空格分开并保存到文件中
核心代码 # -*- coding: utf-8 -*- ''' python读取英文文件,将每个单词按照空格分开,并将每个单词独自放一行 ''' def dcfenhang(infile,outfile): infopen = open(infile,'r',encoding='utf-8') outopen = open(outfile,'w',encoding='utf-8') lines = infopen.readlines() for line in lines: for db in
-
python提取内容关键词的方法
本文实例讲述了python提取内容关键词的方法.分享给大家供大家参考.具体分析如下: 一个非常高效的提取内容关键词的python代码,这段代码只能用于英文文章内容,中文因为要分词,这段代码就无能为力了,不过要加上分词功能,效果和英文是一样的. 复制代码 代码如下: # coding=UTF-8 import nltk from nltk.corpus import brown # This is a fast and simple noun phrase extractor (based on
-
Python进行数据提取的方法总结
准备工作 首先是准备工作,导入需要使用的库,读取并创建数据表取名为loandata. import numpy as np import pandas as pd loandata=pd.DataFrame(pd.read_excel('loan_data.xlsx')) 设置索引字段 在开始提取数据前,先将member_id列设置为索引字段.然后开始提取数据. Loandata = loandata.set_index('member_id') 按行提取信息 第一步是按行提取数据,例如提取某个
-
使用python对文件中的单词进行提取的方法示例
由于需要使用一个纯单词组成的文件,在网上下载到了一个存放单词的文件,但是里面有中文的解释,那就需要做一下提取了. 文本的形式如下: 所见即所得,这个文本是有规律的,每个单词为一行,紧接着下一行便是单词的解释,有了这种规律我们就很好处理了. 首先我们来将文件的数据读取出来: #coding:utf-8 file_object = open('words.txt') try: lines = file_object.readlines() finally: file_object.close( )
-
python实现根据指定字符截取对应的行的内容方法
工作中遇到的,在一个.c文件中有很多函数,这个.c是自动生成的,需要将所有的函数通过extern放到.h中,每个函数都是UINT32 O_开头,通过正则表达式进行字符匹配以及通过linecache来截取特定行. 代码如下: #! /usr/bin/env python # encoding:utf-8 # ! /usr/bin/env python # encoding:utf-8 import re import linecache file = 'D:\PUSCH_job3.txt' out
-
python 截取 取出一部分的字符串方法
下面是split截取获得 >>> str = 'http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf' >>> print str.split() ['http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf'] >>> print str.split('
-
python截取两个单词之间的内容方法
1. __init__ 初始化文件路径,关键字1,关键字2; 2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式): 3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件). #!/usr/bin/python3 # -*- coding: utf-8 -*- import re #文本所在路径,引号前加r指按
-
python计算两个地址之间的距离方法
我们调用高德地图的API来计算经纬度 #计算地址经纬度 import requests def geocode(address): parameters = {'address': address, 'key': 'cb649a25c1f81c1451adbeca73623251'} base = 'http://restapi.amap.com/v3/geocode/geo' response = requests.get(base, parameters) answer = response
-
Python3 获取一大段文本之间两个关键字之间的内容方法
用re或者string.find.以下是re代码 import re #文本所在TXT文件 file = '123.txt' #关键字1,2(修改引号间的内容) w1 = '123' w2 = '456' f = open(file,'r') buff = f.read() #清除换行符,请取消下一行注释 #buff = buff.replace('\n','') pat = re.compile(w1+'(.*?)'+w2,re.S) result = pat.findall(buff) pr
-
JS正则截取两个字符串之间及字符串前后内容的方法
本文实例讲述了JS正则截取两个字符串之间及字符串前后内容的方法.分享给大家供大家参考,具体如下: 1.js截取两个字符串之间的内容: var str = "aaabbbcccdddeeefff"; str = str.match(/aaa(\S*)fff/)[1]; alert(str);//结果bbbcccdddeee 2.js截取某个字符串前面的内容: var str = "aaabbbcccdddeeefff"; tr = str.match(/(\S*)ff
-
JS使用正则截取两个字符串之间的字符串实现方法详解
本文实例讲述了JS使用正则截取两个字符串之间的字符串方法.分享给大家供大家参考,具体如下: 一个最常用的场景 截取两个字符串中间的字符串 var str = "iid0000ffr"; var substr = str.match(/id(\S*)ff/); alert(substr2); 你会发现逗号后面是你要的东西 /S*表示多个字符串 为什么想要的东西在逗号后,也就是数组第二个. 是因为match的返回数组,第一个表示匹配的字符串,这里是包括id ff的,结果是id0000ff
-
Python 实现两个服务器之间文件的上传方法
如下所示: # coding: utf-8 import paramiko import MySQLdb def main(): connection=MySQLdb.connect(host='10.10.41.22',user='root',passwd='root',db='Trojan',port=3306) cur=connection.cursor() sql ='select count(*) from blacklist;' cur.execute(sql) count = cu
-
python matplotlib 在指定的两个点之间连线方法
为了找到matplotlib在两个点之间连线的方法真是费了好大功夫,最后还是决定用简单的 plt.plot 来解决.如果有好多对点,则可以通过循环实现连接,还可以用 plt.arrow 画箭头,具体可参考这里 import matplotlib.pyplot as plt x = [[1, 3], [2, 5]] # 要连接的两个点的坐标 y = [[4, 7], [6, 3]] for i in range(len(x)): plt.plot(x[i], y[i], color='r') pl
-
python匹配两个短语之间的字符实例
如下所示: def ref_txt_demo(): f = open('1.txt', 'r') data = f.readlines() for line in data: line1 = str(line.strip()) result = re.findall('中.*?法', line1) for x in result: print(x) 以上这篇python匹配两个短语之间的字符实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
-
python正则表达式去除两个特殊字符间的内容方法
以去掉去掉<!--和-->为例进行说明: def clearContentWithSpecialCharacter(content): # 先将<!--替换成,普通字符l content = content.replace("<!--","l") # 再将-->替换成,普通字符l content = content.replace("-->","l") # 分组标定,替换, pattern
-
Python计算两个日期相差天数的方法示例
本文实例讲述了Python计算两个日期相差天数的方法.分享给大家供大家参考,具体如下: #!/usr/bin/python import time import sys def dateinput(): date = raw_input('please input the first date: ') return date def datetrans(tdate): spdate = tdate.replace("/","-") try: datesec = ti
随机推荐
- 如何在SQL Server 2005数据库中导入SQL Server 2008的数据
- json对象转字符串如何实现
- 详细讲解vue2+vuex+axios
- 手工注射asp学习
- Java WebService 简单实例(附实例代码)
- WordPress中Gravatar头像缓存到本地及相关优化的技巧
- c_str()的用法详细解析
- Ajax传递中文参数到后台乱码的有效解决方法
- Django中几种重定向方法
- 简单了解C#设计模式编程中的桥接模式
- 浅谈Maven的安装及修改为阿里云下载依赖
- jQuery EasyUI API 中文文档 可调整尺寸
- jQuery DOM操作实例
- jQuery中width()方法用法实例
- 浅谈Web页面向后台提交数据的方式和选择
- Android自定义textview实现竖直滚动跑马灯效果
- Android学习项目之简易版微信为例(一)
- Java微信公众平台开发(4) 回复消息的分类及实体的创建
- Android百度地图应用之图层展示
- 解决android studio android monitor打不开的问题