python截取两个单词之间的内容方法

2025-04-09 15:19:11

1. __init__ 初始化文件路径，关键字1，关键字2;

2. key_match 使用with open 方法，以二进制方式（也可以改成utf-8，GB2312）读取文件内容（支持txt/log格式）；

3. buffer = f.read() 一致性读取到buffer中，读取超大文件会发生MemoryError（可以设置每次读取的size或切割文件）。

#!/usr/bin/python3
# -*- coding: utf-8 -*-

import re

#文本所在路径，引号前加r指按路径处理
#关键字word1,word2,换关键字，需修改引号间的内容

class match2Words(object):
 lines=0
 def __init__(self,path,word1,word2):
  self.path = path
  self.word1 = word1
  self.word2 = word2
 def key_match(self):
  with open(self.path,'rb') as f:
   buffer = f.read()
   pattern = re.compile(self.word1+b'(.*?)'+self.word2,re.S)
   result = pattern.findall(buffer)
   if result != []:
    print(result)
    #self.lines +=1
    #print("匹配到的行数：",self.lines)
   else:
    print("没有找到你输入的关键字")

path = input("请输入要分析的log地址：")
word1 = b"begin"
word2 = b"end"
matchWords = match2Words(path, word1, word2)
matchWords.key_match()

以上这篇python截取两个单词之间的内容方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持我们。

python实现根据指定字符截取对应的行的内容方法

工作中遇到的,在一个.c文件中有很多函数,这个.c是自动生成的,需要将所有的函数通过extern放到.h中,每个函数都是UINT32 O_开头,通过正则表达式进行字符匹配以及通过linecache来截取特定行. 代码如下: #! /usr/bin/env python # encoding:utf-8 # ! /usr/bin/env python # encoding:utf-8 import re import linecache file = 'D:\PUSCH_job3.txt' out
使用python对文件中的单词进行提取的方法示例

由于需要使用一个纯单词组成的文件,在网上下载到了一个存放单词的文件,但是里面有中文的解释,那就需要做一下提取了. 文本的形式如下: 所见即所得,这个文本是有规律的,每个单词为一行,紧接着下一行便是单词的解释,有了这种规律我们就很好处理了. 首先我们来将文件的数据读取出来: #coding:utf-8 file_object = open('words.txt') try: lines = file_object.readlines() finally: file_object.close( )
python提取内容关键词的方法

本文实例讲述了python提取内容关键词的方法.分享给大家供大家参考.具体分析如下: 一个非常高效的提取内容关键词的python代码,这段代码只能用于英文文章内容,中文因为要分词,这段代码就无能为力了,不过要加上分词功能,效果和英文是一样的. 复制代码代码如下: # coding=UTF-8 import nltk from nltk.corpus import brown # This is a fast and simple noun phrase extractor (based on
python 截取取出一部分的字符串方法

下面是split截取获得 >>> str = 'http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf' >>> print str.split() ['http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf'] >>> print str.split('
python将每个单词按空格分开并保存到文件中

核心代码 # -*- coding: utf-8 -*- ''' python读取英文文件,将每个单词按照空格分开,并将每个单词独自放一行 ''' def dcfenhang(infile,outfile): infopen = open(infile,'r',encoding='utf-8') outopen = open(outfile,'w',encoding='utf-8') lines = infopen.readlines() for line in lines: for db in
Python进行数据提取的方法总结

准备工作首先是准备工作,导入需要使用的库,读取并创建数据表取名为loandata. import numpy as np import pandas as pd loandata=pd.DataFrame(pd.read_excel('loan_data.xlsx')) 设置索引字段在开始提取数据前,先将member_id列设置为索引字段.然后开始提取数据. Loandata = loandata.set_index('member_id') 按行提取信息第一步是按行提取数据,例如提取某个
python截取两个单词之间的内容方法

1. __init__ 初始化文件路径,关键字1,关键字2; 2. key_match 使用with open 方法,以二进制方式(也可以改成utf-8,GB2312)读取文件内容(支持txt/log格式): 3. buffer = f.read() 一致性读取到buffer中,读取超大文件会发生MemoryError(可以设置每次读取的size或切割文件). #!/usr/bin/python3 # -*- coding: utf-8 -*- import re #文本所在路径,引号前加r指按
python计算两个地址之间的距离方法

我们调用高德地图的API来计算经纬度 #计算地址经纬度 import requests def geocode(address): parameters = {'address': address, 'key': 'cb649a25c1f81c1451adbeca73623251'} base = 'http://restapi.amap.com/v3/geocode/geo' response = requests.get(base, parameters) answer = response
Python3 获取一大段文本之间两个关键字之间的内容方法

用re或者string.find.以下是re代码 import re #文本所在TXT文件 file = '123.txt' #关键字1,2(修改引号间的内容) w1 = '123' w2 = '456' f = open(file,'r') buff = f.read() #清除换行符,请取消下一行注释 #buff = buff.replace('\n','') pat = re.compile(w1+'(.*?)'+w2,re.S) result = pat.findall(buff) pr
JS正则截取两个字符串之间及字符串前后内容的方法

本文实例讲述了JS正则截取两个字符串之间及字符串前后内容的方法.分享给大家供大家参考,具体如下: 1.js截取两个字符串之间的内容: var str = "aaabbbcccdddeeefff"; str = str.match(/aaa(\S*)fff/)[1]; alert(str);//结果bbbcccdddeee 2.js截取某个字符串前面的内容: var str = "aaabbbcccdddeeefff"; tr = str.match(/(\S*)ff
JS使用正则截取两个字符串之间的字符串实现方法详解

本文实例讲述了JS使用正则截取两个字符串之间的字符串方法.分享给大家供大家参考,具体如下: 一个最常用的场景截取两个字符串中间的字符串 var str = "iid0000ffr"; var substr = str.match(/id(\S*)ff/); alert(substr2); 你会发现逗号后面是你要的东西 /S*表示多个字符串为什么想要的东西在逗号后,也就是数组第二个. 是因为match的返回数组,第一个表示匹配的字符串,这里是包括id ff的,结果是id0000ff
Python 实现两个服务器之间文件的上传方法

如下所示: # coding: utf-8 import paramiko import MySQLdb def main(): connection=MySQLdb.connect(host='10.10.41.22',user='root',passwd='root',db='Trojan',port=3306) cur=connection.cursor() sql ='select count(*) from blacklist;' cur.execute(sql) count = cu
python matplotlib 在指定的两个点之间连线方法

为了找到matplotlib在两个点之间连线的方法真是费了好大功夫,最后还是决定用简单的 plt.plot 来解决.如果有好多对点,则可以通过循环实现连接,还可以用 plt.arrow 画箭头,具体可参考这里 import matplotlib.pyplot as plt x = [[1, 3], [2, 5]] # 要连接的两个点的坐标 y = [[4, 7], [6, 3]] for i in range(len(x)): plt.plot(x[i], y[i], color='r') pl
python匹配两个短语之间的字符实例

如下所示: def ref_txt_demo(): f = open('1.txt', 'r') data = f.readlines() for line in data: line1 = str(line.strip()) result = re.findall('中.*?法', line1) for x in result: print(x) 以上这篇python匹配两个短语之间的字符实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.
python正则表达式去除两个特殊字符间的内容方法

以去掉去掉为例进行说明: def clearContentWithSpecialCharacter(content): # 先将替换成,普通字符l content = content.replace("-->","l") # 分组标定,替换, pattern
Python计算两个日期相差天数的方法示例

本文实例讲述了Python计算两个日期相差天数的方法.分享给大家供大家参考,具体如下: #!/usr/bin/python import time import sys def dateinput(): date = raw_input('please input the first date: ') return date def datetrans(tdate): spdate = tdate.replace("/","-") try: datesec = ti

python截取两个单词之间的内容方法

相关推荐

随机推荐