Python编程之Re模块下的函数介绍

re模块下的函数

compile(pattern):创建模式对象

import re
pat=re.compile('A')
m=pat.search('CBA')          #等价于 re.search('A','CBA')
print m
<_sre.SRE_Match object at 0x9d690c8>  #匹配到了,返回MatchObject(True)
m=pat.search('CBD')
print m
None                  #没有匹配到,返回None(False)

search(pattern,string):在字符串中寻找模式

m = re.search('asd','ASDasd')
print m
<_sre.SRE_Match object at 0xb72cd6e8> #匹配到了,返回MatchObject(True)
m = re.search('asd','ASDASD')
print m
None                  #没有匹配到,返回None(False)

match(pattern,string):在字符串开始处匹配模式

m = re.search('asd','ASDasd')
print m
<_sre.SRE_Match object at 0xb72cd6e8> #匹配到了,返回MatchObject(True)
m = re.search('asd','ASDASD')
print m
None                  #没有匹配到,返回None(False)

等价于

pat=re.compile('a')
print pat.match('Aasd')
None
printpat.match('aASD')
<_sre.SRE_Match object at 0xb72cd6e8>

上面的函数返回都可以在if条件语句中进行判断:

if pat.search('asd'):
...   print 'OK'
...
OK    #找到返回
if re.search('a','ASD'):
...   print "OK"
...    #没有找到

split(pattern,string):根据模式分割字符串,返回列表

re.split(',','a,s,d,asd')
['a', 's', 'd', 'asd']     #返回列表

pat = re.compile(',')
pat.split('a,s,d,asd')
['a', 's', 'd', 'asd']     #返回列表

re.split('[, ]+','a , s ,d   ,,,,,asd')  #正则匹配:[, ]+,后面说明
['a', 's', 'd', 'asd']

re.split('[, ]+','a , s ,d   ,,,,,asd',maxsplit=2) # maxsplit 最多分割次数
['a', 's', 'd   ,,,,,asd']

pat = re.compile('[, ]+')           #正则匹配:[, ]+,后面说明
pat.split('a , s ,d   ,,,,,asd',maxsplit=2)    # maxsplit 最多分割次数
['a', 's', 'd   ,,,,,asd']

findall(pattern,string):列表形式返回匹配项

re.findall('a','ASDaDFGAa')
['a', 'a']              #列表形式返回匹配到的字符串
pat = re.compile('a')
pat.findall('ASDaDFGAa')
['a', 'a']              #列表形式返回匹配到的字符串
pat = re.compile('[A-Z]+')    #正则匹配:'[A-Z]+' 后面有说明
pat.findall('ASDcDFGAa')
['ASD', 'DFGA']           #找到匹配到的字符串
pat = re.compile('[A-Z]')
pat.findall('ASDcDFGAa')     #正则匹配:'[A-Z]+' 后面有说明
['A', 'S', 'D', 'D', 'F', 'G', 'A'] #找到匹配到的字符串
pat = re.compile('[A-Za-z]')   #正则匹配:'[A-Za-z]+' 匹配所有单词,后面有说明
pat.findall('ASDcDFGAa')
['A', 'S', 'D', 'c', 'D', 'F', 'G', 'A', 'a'] 

sub(pat,repl,string) :用repl替换 pat匹配项

(留的是中间的,因为中间在中心)

 re.sub('a','A','abcasd')  #找到a用A替换,后面见和group的配合使用
'AbcAsd'
pat = re.compile('a')
pat.sub('A','abcasd')
'AbcAsd'
 pat=re.compile(r'www\.(.*)\..{3}') #正则表达式
 #在Python的string前面加上‘r', 是为了告诉编译器这个string是个raw string,不要转译反斜杠 '\' 。
 #例如,\n 在raw string中,是两个字符,\和n, 而不会转译为换行符。
 #由于正则表达式和 \ 会有冲突,因此,当一个字符串使用了正则表达式后,最好在前面加上'r'。
  #与大多数编程语言相同,正则表达式里使用"\"作为转义字符,这就可能造成反斜杠困扰。
  #假如你需要匹配文本中的字符"\",那么使用编程语言表示的正则表达式里将需要4个反斜杠"\\\\":
  #前两个和后两个分别用于在编程语言里转义成反斜杠,转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。
  #Python里的原生字符串很好地解决了这个问题,这个例子中的正则表达式可以使用r"\\"表示。
  #同样,匹配一个数字的"\\d"可以写成r"\d"。
  #有了原生字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
  #不是说 加了r \就没有转译功能,好乱,就直接记住1句话:
  #当一个字符串使用了正则表达式后,最好在前面加上'r',这样你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观
pat.match('www.dxy.com').group(1)
'dxy'
re.sub(r'www\.(.*)\..{3}',r'\1','hello,www.dxy.com')
pat.sub(r'\1','hello,www.dxy.com')
'hello,dxy'
# r'1' 是第一组的意思
#通过正则匹配找到符合规则的"www.dxy.com" ,取得 组1字符串 去替换 整个匹配。
 pat=re.compile(r'(\w+) (\w+)')   #正则表达式
s='hello world ! hello hz !'
pat.findall('hello world ! hello hz !')
[('hello', 'world'), ('hello', 'hz')]
pat.sub(r'\2 \1',s)        #通过正则得到组1(hello),组2(world),再通过sub去替换。即组1替换组2,组2替换组1,调换位置。
'world hello!hz hello!'

escape(string) :对字符串里面的特殊字符串进行转义

re.escape('www.dxy.cn')
'www\\.dxy\\.cn'          #转义

上面的函数中,只有match、search有group方法,其他的函数没有。

函数的方法

group:获取子模式(组)的匹配项

pat = re.compile(r'www\.(.*)\.(.*)')    #用()表示1个组,2个组
m = pat.match('www.dxy.com')
m.group()                 #默认为0,表示匹配整个字符串
'www.dxy.com'
m.group(1)                 #返回给定组1匹配的子字符串
'dxy'
m.group(2)
'com'

start:给定组匹配项的开始位置

m.start(2)                 #组2开始的索引
8

end:给定组匹配项的结束位置

m.end(2)                  #组2结束的索引
11

span: 给定组匹配项的开始结束位置

 m.span(2)                 #组2开始、结束的索引
(8, 11)

正则表达式

正则表达式(可以称为REs,regex,regex pattens)是一个小巧的,高度专业化的编程语言,它内嵌于python开发语言中,可通过re模块使用。正则表达式的pattern可以被编译成一系列的字节码,然后用C编写的引擎执行。下面简单介绍下正则表达式的语法。

元字符

“.” :通配符,除换行符外的任意的1个字符

pat=re.compile('.')
pat.match('abc')
<_sre.SRE_Match object at 0xb72b6170>
pat.match('abc').group()
'a'                #匹配到了首个字符
pat.search('abc').group()
'a'
pat.match('\n').group()    #换行符匹配出错
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'

“\” : 转义符

pat=re.compile('\.')
pat.search('abc.efg').group() #匹配到.
'.'
 pat.findall('abc.efg')     #不用group,返回列表
['.']

“[…]” : 字符集合,匹配里面的任意一个元素

>>> pat=re.compile('[abc]')
>>> pat.match('axbycz').group()
'a'
>>> pat.search('axbycz').group()
'a'
>>> pat.findall('axbycz')
['a', 'b', 'c']

“\d” : 数字

>>> pat=re.compile('\d')
>>> pat.search('ax1by2cz3').group()  #匹配到第一个数字:1,返回
'1'
>>> pat.match('ax1by2cz3').group()  #匹配不到(首个不是)返回None,报错,match匹配字符串头
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'
>>> pat.findall('ax1by2cz3')     #匹配所有的数字,列表返回
['1', '2', '3']

“\D” : 非数字

>>> pat=re.compile('\D')
>>> pat.match('ax1by2cz3').group()
'a'
>>> pat.search('ax1by2cz3').group()
'a'
>>> pat.findall('ax1by2cz3')
['a', 'x', 'b', 'y', 'c', 'z']

“\s” :空白字符 、 \t、\r、\n、空格

>>> pat=re.compile('\s')
>>> pat.findall('\rax1 \nby2 \tcz3')
['\r', ' ', '\n', ' ', '\t']
>>> pat.search('\rax1 \nby2 \tcz3').group()
'\r'
>>> pat.match('\rax1 \nby2 \tcz3').group()
'\r'

“S” :非空白字符

>>> pat=re.compile('\S')
>>> pat.search('\rax1 \nby2 \tcz3').group()
'a'
>>> pat.findall('\rax1 \nby2 \tcz3')
['a', 'x', '1', 'b', 'y', '2', 'c', 'z', '3']

“\w” :单个的 数字和字母,[A-Za-z0-9]

>>> pat=re.compile('\w')
>>> pat.search('1a2b3c').group()
'1'
>>> pat.findall('1a2b3c')
['1', 'a', '2', 'b', '3', 'c']
>>> pat.match('1a2b3c').group()
'1'

“\W”:非单词字符,除数字和字母外

>>> pat=re.compile('\W')
>>> pat.findall('1a2我b3c') #python是用三字节表示一个汉字
['\xe6', '\x88', '\x91']
>>> pat.search('1a2我b3c').group()
'\xe6'

数量词

“*” :0次或多次

( 乘0会变成0)

>>> pat = re.compile('[abc]*')
>>> pat.match('abcabcdefabc').group()
'abcabc'               #2次
>>> pat.search('abcabcdefabc').group()
'abcabc'               #2次
>>> pat.findall('abcabcdefabc')
['abcabc', '', '', '', 'abc', '']   #2次和1次,因为有0次,所以匹配了''

“+” :1次或多次

( 加0不会变成0)

>>> pat = re.compile('[abc]+')
>>> pat.match('abcdefabcabc').group()
'abc'
>>> pat.search('abcdefabcabc').group()
'abc'
>>> pat.findall('abcdefabcabc')
['abc', 'abcabc']

“?” :0次或1次,match,search 不会出现none,会出现' ‘ (因为0次也是符合的)

0次或1次不是指[xxx]这个集合,而是其中的任何的一个字符

>>> pat = re.compile('[abc]?')
>>> pat.match('defabc').group()   #0次
''
>>> pat.match('abcdefabc').group()
'a'
>>> pat.search('defabc').group()  #0次
''
>>> pat.findall('defabc')      #0次和1次
['', '', '', 'a', 'b', 'c', '']   #后面总再加个''

“数量词?” :非贪婪模式:只匹配最少的(尽可能少);默认贪婪模式:匹配最多的(尽可能多)

>>> pat = re.compile('[abc]+')     #贪婪模式
>>> pat.match('abcdefabcabc').group() #匹配尽可能多的:abc
'abc'
>>> pat.match('bbabcdefabcabc').group()
'bbabc'
>>> pat.search('dbbabcdefabcabc').group()
'bbabc'
>>> pat.findall('abcdefabcabc')
['abc', 'abcabc']
>>> pat = re.compile('[abc]+?')    #非贪婪模式:+?
>>> pat.match('abcdefabcabc').group() #匹配尽可能少的:a、b、c
'a'
>>> pat.search('dbbabcdefabcabc').group()
'b'
>>> pat.findall('abcdefabcabc')
['a', 'b', 'c', 'a', 'b', 'c', 'a', 'b', 'c']

“{m}” :匹配字符串出现m次

>>> pat = re.compile('[op]{2}')   #o或p出现2次
>>> pat.search('abcooapp').group() #匹配第一次出现的字符串,o比p先出现
'oo'
>>> pat.findall('abcooapp')     #匹配出现的所有字符串,列表形式返回
['oo', 'pp']

“{m,n}” :匹配字符串出现m到n次

>>> pat = re.compile('[op]{2,4}')   #o或则p出现2到4次
>>> pat.match('pppabcooapp').group() #匹配开头
'ppp'
>>> pat.search('pppabcooapp').group() #匹配第一次出现
'ppp'
>>> pat.findall('pppabcooapp')    #匹配所有
['ppp', 'oo', 'pp']

.group() #匹配第一次出现

边界

“^” :匹配字符串开头或行头

>>> pat = re.compile('^[abc]')   #开头是a、b、c中的任意一个
>>> pat.search('defabc').group()
>>> pat.match('defabc').group()  #均找不到
>>> pat.findall('defabc')
[]
>>> pat.search('adefabc').group()
'a'
>>> pat.match('adefabc').group()  #开头是a、b、c中的任意一个
'a'
>>> pat.findall('adefabc')
['a']
>>> pat = re.compile('^[abc]+')  #开头是a、b、c中的任意一个的一次或则多次,贪婪:匹配多个
>>> pat.findall('cbadefab')
['cba']
>>> pat = re.compile(r'^[abc]+?') #开头是a、b、c中的任意一个的一次或则多次,非贪婪:匹配一个
>>> pat.findall('cbadefab')
['c']

“$” :匹配字符串结尾或则行尾

>>> pat = re.compile('[abc]$')
>>> pat.match('adefAbc').group()  #match匹配的是字符串开头,所以查找$的时,总是返回None
>>> pat.search('adefAbc').group() #结尾是a、b、c中的任意一个
'c'
>>> pat.findall('adefAbc')
['c']
>>> pat = re.compile('[abc]+$')
>>> pat.search('adefAbc').group() #结尾是a、b、c中的任意一个的一次或则多次,贪婪:匹配多个
'bc'
>>> pat.findall('adefAbc')
['bc']

“\A”:匹配字符串开头

>>> pat = re.compile('\A[abc]+')
>>> pat.findall('cbadefab')
['cba']
>>> pat.search('cbadefab').group()
'cba'

“\Z”:匹配字符串结尾

>>> pat = re.compile('[abc]+\Z')
>>> pat.search('cbadefab').group()
'ab'
>>> pat.findall('cbadefab')
['ab']

分组

(…):分组匹配,从左到右,每遇到一个 ( 编号+1,分组后面可加数量词

>>> pat=re.compile(r'(a)\w(c)') #\w:单个的数字或字母 [A-Za-z0-9]
>>> pat.match('abcdef').group()
'abc'
>>> pat=re.compile('(a)b(c)')  #分2组,匿名分组 

>>> pat.match('abcdef').group() #默认返回匹配的字符串
'abc'
>>> pat.match('abcdef').group(1) #取分组1,适用于search
'a'
>>> pat.match('abcdef').group(2) #取分组2,适用于search
'c'
>>> pat.match('abcdef').groups() #取所有分组,元组形式返回
('a', 'c')

<number>:引用编号为<number>的分组匹配到的字符串

>>> pat=re.compile(r'www\.(.*)\..{3}')
>>> pat.match('www.dxy.com').group(1)
'dxy'

“(?P<name>…)” :在模式里面用()来表示分组(命名分组),适用于提取目标字符串中的某一些部位。

>>> pat=re.compile(r'(?P<K>a)\w(c)')  #分2组:命名分组+匿名分组
>>> pat.search('abcdef').groups()    #取所有分组,元组形式返回
('a', 'c')
>>> pat.search('abcdef').group(1)    #取分组1,适用于match
'a'
>>> pat.search('abcdef').group(2)    #取分组2,适用于match
'c'
>>> pat.search('abcdef').group()    #默认返回匹配的字符串
'abc'
>>> pat.search('abcdef').groupdict()  #命名分组可以返回一个字典【专有】,匿名分组也没有
{'K': 'a'}

“(?P=name)”:引用别名为<name>的分组匹配到的串

>>> pat=re.compile(r'(?P<K>a)\w(c)(?P=K)')  #(?P=K)引用分组1的值,就是a
>>> pat.search('abcdef').group()       #匹配不到,因为完整'a\wca',模式的第4位是a
Traceback (most recent call last):
 File "<stdin>", line 1, in <module>
AttributeError: 'NoneType' object has no attribute 'group'

>>> pat.search('abcadef').group()       #匹配到,模式的第4位和组1一样,值是c
'abca'
>>> pat.search('abcadef').groups()
('a', 'c')
>>> pat.search('abcadef').group(1)
'a'
>>> pat.search('abcadef').group(2)
'c

“<number>” :引用分组编号匹配:

>>> pat=re.compile(r'(?P<K>a)\w(c)(?P=K)\2') #\2引用分组2的值,就是c
>>> pat.findall('Aabcadef')          #匹配不到,因为完整'a\wcac',模式的第5位是c
[]
>>> pat.findall('Aabcacdef')         #匹配到,模式的第5位和组2一样,值是c
[('a', 'c')]
>>> pat.search('Aabcacdef').groups()
('a', 'c')
>>> pat.search('Aabcacdef').group()
'abcac'
>>> pat.search('Aabcacdef').group(1)
'a'
>>> pat.search('Aabcacdef').group(2)
'c'

特殊构造

(?:…) (…)不分组版本,用于使用 | 或者后接数量词
(?iLmsux) iLmsux的每个字符代表一个匹配模式,只能用在正则表达式的开头,可选多个
(?#…) #号后的内容将作为注释
(?=…) 之后的字符串内容需要匹配表达式才能成功匹配
(?!…) 之后的字符串不匹配表达式才能成功
(?(?(?(id/name) yes |no) 如果编号为id/名字为name的组匹配到字符串,则需要匹配yes,否则匹配no,no可以省略
“(?:…)” :()里面有?:表示该()不是分组

>>> pat=re.compile(r'a(?:bc)')
>>> pat.findall('abc')
['abc']
>>> pat.match('abc').groups()   #显示不出分组

“(?=…)”:匹配…表达式,返回。对后进行匹配,总是对后面进行匹配

>>> pat=re.compile(r'\w(?=\d)')  #匹配表达式\d,返回数字的前一位,\w:单词字符[A-Za-z0-9]
>>> pat.findall('abc1 def1 xyz1')
['c', 'f', 'z']
>>> pat.findall('zhoujy20130628hangzhou') #匹配数字的前一位,列表返回
['y', '2', '0', '1', '3', '0', '6', '2']
>>> pat=re.compile(r'\w+(?=\d)')
>>> pat.findall('abc1,def1,xyz1')     #匹配最末数字的前字符串,列表返回
['abc', 'def', 'xyz']
>>> pat.findall('abc21,def31,xyz41')
['abc2', 'def3', 'xyz4']
>>> pat.findall('zhoujy20130628hangzhou')
['zhoujy2013062']
>>> pat=re.compile(r'[A-Za-z]+(?=\d)')    #[A-Za-z],匹配字母,可以用其他的正则方法
>>> pat.findall('zhoujy20130628hangzhou123') #匹配后面带有数字的字符串,列表返回
['zhoujy', 'hangzhou']
>>> pat.findall('abc21,def31,xyz41')
['abc', 'def', 'xyz']

“(?!…)” 不匹配…表达式,返回。对后进行匹配

>>> pat=re.compile(r'[A-Za-z]+(?!\d)')    #[A-Za-z],匹配字母,可以用其他的正则方法
>>> pat.findall('zhoujy20130628hangzhou123,12,binjiang310') #匹配后面不是数字的字符串,列表返回
['zhouj', 'hangzho', 'binjian']
>>> pat.findall('abc21,def31,xyz41')
['ab', 'de', 'xy']

“(?<=…)”:匹配…表达式,返回。对前进行匹配,总是对前面进行匹配

>>> pat=re.compile(r'(?<=\d)[A-Za-z]+')   #匹配前面是数字的字母
>>> pat.findall('abc21,def31,xyz41')
[]
>>> pat.findall('1abc21,2def31,3xyz41')
['abc', 'def', 'xyz']
>>> pat.findall('zhoujy20130628hangzhou123,12,binjiang310')
['hangzhou']

“(?<!…)”:不匹配…表达式,返回。对前进行匹配,总是对前面进行匹配

>>> pat=re.compile(r'(?<!\d)[A-Za-z]+')   #匹配前面不是数字的字母
>>> pat.findall('abc21,def31,xyz41')
['abc', 'def', 'xyz']
>>> pat.findall('zhoujy20130628hangzhou123,12,binjiang310')
['zhoujy', 'angzhou', 'binjiang']

“(?(id/name) yes |no)”: 组是否匹配,匹配返回

>>> pat=re.compile(r'a(\d)?bc(?(1)\d)')  #no省略了,完整的是a\dbc\d ==> a2bc3,总共5位,第2位是可有可无的数字,第5为是数字
>>> pat.findall('abc9')          #返回组1,但第2位(组1)没有,即返回了''
['']
>>> pat.findall('a8bc9')         #完整的模式,返回组1
['8']
>>> pat.match('a8bc9').group()
'a8bc9'
>>> pat.match('a8bc9').group(1)
'8'
>>> pat.findall('a8bc')          #第5位不存在,则没有匹配到
[]

“(?iLmsux)”:这里就介绍下i参数:大小写区分匹配

>>> pat=re.compile(r'abc')
>>> pat.findall('abc')
['abc']
>>> pat.findall('ABC')
[]
>>> pat=re.compile(r'(?i)abc')      #(?i) 不区分大小写
>>> pat.findall('ABC')
['ABC']
>>> pat.findall('abc')
['abc']
>>> pat.findall('aBc')
['aBc']
>>> pat.findall('aBC')
['aBC']
>>> pat=re.compile(r'abc',re.I)      #re.I 作为参数使用,推荐
>>> pat.findall('aBC')
['aBC']
>>> pat.findall('abc')
['abc']
>>> pat.findall('ABC')
['ABC']

总结

以上就是本文关于Python编程之Re模块下的函数介绍的全部内容,希望对大家有所帮助。感兴趣的朋友可以继续参阅本站:Python探索之静态方法和类方法的区别详解、Python探索之爬取电商售卖信息代码示例等,如有不足之处,欢迎留言指出。感谢朋友们对本站的支持!

(0)

相关推荐

  • python numpy函数中的linspace创建等差数列详解

    前言 本文主要给大家介绍的是关于linspace创建等差数列的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. numpy.linspace 是用于创建一个由等差数列构成的一维数组.它最长用的有三个参数,当然不止三个. 第一个例子,用到三个参数,第一个参数表示起始点.第二个参数表示终止点,第三个参数表示数列的个数. import numpy as np print(np.linspace(1,10,10,endpoint=False)) 创建一个元素全部为1的等差数列,

  • 深入理解python中函数传递参数是值传递还是引用传递

    目前网络上大部分博客的结论都是这样的: Python不允许程序员选择采用传值还是传 引用.Python参数传递采用的肯定是"传对象引用"的方式.实际上,这种方式相当于传值和传引用的一种综合.如果函数收到的是一个可变对象(比如字典 或者列表)的引用,就能修改对象的原始值--相当于通过"传引用"来传递对象.如果函数收到的是一个不可变对象(比如数字.字符或者元组)的引用,就不能 直接修改原始对象--相当于通过"传值"来传递对象. 你可以在很多讨论该问题

  • Python内建函数之raw_input()与input()代码解析

    这两个均是 python 的内建函数,通过读取控制台的输入与用户实现交互.但他们的功能不尽相同.举两个小例子. >>> raw_input_A = raw_input("raw_input: ") raw_input: abc >>> input_A = input("Input: ") Input: abc Traceback(most recent call last): File "<pyshell#1>

  • Python中的id()函数指的什么

    Python官方文档给出的解释是 id(object) Return the "identity" of an object. This is an integer (or long integer) which is guaranteed to be unique and constant for this object during its lifetime. Two objects with non-overlapping lifetimes may have the same

  • python 中的int()函数怎么用

    int(x, [base]) 功能: 函数的作用是将一个数字或base类型的字符串转换成整数. 函数原型: int(x=0) int(x, base=10),base缺省值为10,也就是说不指定base的值时,函数将x按十进制处理. 适用Python版本: Python2.x Python3.x 注意: 1. x 可以是数字或字符串,但是base被赋值后 x 只能是字符串 2. x 作为字符串时必须是 base 类型,也就是说 x 变成数字时必须能用 base 进制表示 Python英文文档解释

  • 简单了解Python中的几种函数

    几个特殊的函数(待补充) python是支持多种范型的语言,可以进行所谓函数式编程,其突出体现在有这么几个函数: filter.map.reduce.lambda.yield lambda >>> g = lambda x,y:x+y #x+y,并返回结果 >>> g(3,4) 7 >>> (lambda x:x**2)(4) #返回4的平方 16 lambda函数的使用方法: 在lambda后面直接跟变量 变量后面是冒号 冒号后面是表达式,表达式计算

  • python中map()函数的使用方法示例

    前言 在python里有一个函数map(),它有点高大上的感觉.本文将详细给大家介绍python中map()函数使用的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍: 或许你已经看过GOOGLE最挣钱的论文: "MapReduce: Simplified Data Processing on Large Clusters" Google的那篇MapReduce论文里说:Our abstraction is inspired by the map and redu

  • Python编程之Re模块下的函数介绍

    re模块下的函数 compile(pattern):创建模式对象 import re pat=re.compile('A') m=pat.search('CBA') #等价于 re.search('A','CBA') print m <_sre.SRE_Match object at 0x9d690c8> #匹配到了,返回MatchObject(True) m=pat.search('CBD') print m None #没有匹配到,返回None(False) search(pattern,

  • Python网络编程之xmlrpc模块

    简介 rpc:远程过程调用协议.简单的来说就是客户端可以很方便得远程调用服务端的接口程序,而不用管底层是如何实现的. XML-RPC的全称是XML Remote Procedure Call,即XML(标准通用标记语言下的一个子集)远程过程调用.它是一套允许运行在不同操作系统.不同环境的程序实现基于Internet过程调用的规范和一系列的实现.这种远程过程调用使用http作为传输协议,XML作为传送信息的编码格式.Xml-Rpc的定义尽可能的保持了简单,但同时能够传送.处理.返回复杂的数据结构.

  • Python网络编程之ftplib模块

    Python中默认安装的ftplib模块定义了FTP类,可用来实现简单的ftp客户端,用于上传或下载文件. ftp登陆连接 from ftplib import FTP # 加载ftp模块 ftp = FTP() # 设置变量 ftp.set_debuglevel(2) # 打开调试级别2,显示详细信息 ftp.connect("10.126.64.14", 21) # 连接的ftp sever和端口 ftp.login("usr_esop", "PWD4

  • Python多线程编程之threading模块详解

    一.介绍 线程是什么?线程有啥用?线程和进程的区别是什么? 线程是操作系统能够进行运算调度的最小单位.被包含在进程中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务. 二.Python如何创建线程 2.1 方法一: 创建Thread对象 步骤: 1.目标函数 2.实例化Thread对象 3.调用start()方法 import threading # 目标函数1 def fun1(num): for i in range(

  • python编程之requests在网络请求中添加cookies参数方法详解

    哎,好久没有学习爬虫了,现在想要重新拾起来.发现之前学习爬虫有些粗糙,竟然连requests中添加cookies都没有掌握,惭愧.废话不宜多,直接上内容. 我们平时使用requests获取网络内容很简单,几行代码搞定了,例如: import requests res=requests.get("https://cloud.flyme.cn/browser/index.jsp") print res.content 你没有看错,真的只有三行代码.但是简单归简单,问题还是不少的. 首先,这

  • python 编程之twisted详解及简单实例

    python 编程之twisted详解 前言: 我不擅长写socket代码.一是用c写起来比较麻烦,二是自己平时也没有这方面的需求.等到自己真正想了解的时候,才发现自己在这方面确实有需要改进的地方.最近由于项目的原因需要写一些Python代码,才发现在python下面开发socket是一件多么爽的事情. 对于大多数socket来说,用户其实只要关注三个事件就可以了.这分别是创建.删除.和收发数据.python中的twisted库正好可以帮助我们完成这么一个目标,实用起来也不麻烦.下面的代码来自t

  • Python编程之string相关操作实例详解

    本文实例讲述了Python编程之string相关操作.分享给大家供大家参考,具体如下: #coding=utf8 ''''' 字符串是Python中最常见的类型.可以通过引号见包含字符的方式创建. Python里面单引号和双引号的作用是相同的. 字符串是不可变类型,就是说改变一个字符串的元素需要新建一个新的字符串. 字符串是由独立的字符组成,并且这些字符可以通过切片操作顺序地访问. ''' class StringClass(object): ''''' 创建一个字符串就像使用一个标量一样简单.

  • Python编程之gui程序实现简单文件浏览器代码

    本文主要分享了关于在python中实现一个简单的文件浏览器的代码示例,代码及展示如下. #!/usr/bin/env python # -*- coding: UTF-8 -*- import os from time import sleep from Tkinter import * class DirList(object): def __init__(self, initdir=None): '''构造函数,说明版本信息''' self.top = Tk() self.label = L

  • Android编程之ICS式下拉菜单PopupWindow实现方法详解(附源码下载)

    本文实例讲述了Android编程之ICS式下拉菜单PopupWindow实现方法.分享给大家供大家参考,具体如下: 运行效果截图如下: 右边这个就是下拉菜单啦,看见有的地方叫他 ICS式下拉菜单,哎哟,不错哦! 下面先讲一下实现原理: 这种菜单实际上就是一个弹出式的菜单,于是我们想到android PopupWindow 类,给他设置一个view 在弹出来不就OK了吗. PopupWindow 的用法也很简单 主要方法: 步骤1.new 一个实例出来,我们使用这个构造方法即可, 复制代码 代码如

  • Python正则表达re模块之findall()函数详解

    一.re.findall函数介绍 它在re.py中有定义: def findall(pattern, string, flags=0): """Return a list of all non-overlapping matches in the string. If one or more capturing groups are present in the pattern, return a list of groups; this will be a list of

随机推荐