Python入门篇之字符串

所有标准的序列操作对字符串都适用,但字符串是不可变的

字符串常量:

单引号:‘spa"m'

双引号:"spa'm"

三引号:'''...spam...''',"""...spam..."""

转义字符:"s\tp\na\om"

Raw字符串:r"C:\new\test.spm"

Unicode字符串:u'eggs\u0020spam

单双引号是一样的
单双引号可以互换,字符常量表达式可以用两个单引号或两个双引号来表示--两种形式同样有效返回相同类型的对象:

代码如下:

>>> 'zxcvbn',"zxcvbn"
('zxcvbn', 'zxcvbn')
>>> #不适用转义字符就可以实现在一个字符串中包含其余种类 的引号
>>> 'knight"s',"knight's"
('knight"s', "knight's")

可以自动在任意的表达式中合并相邻的字符串常量,尽管也可以使用+操作符实现:

代码如下:

>>> title="sdfsd"'dfg'"fgfd"
>>> title
'sdfsddfgfgfd'

字符串的格式化使用字符%来实现:

在%的左侧放置一个字符串,右侧放置希望格式化的值,可以使用一个值,也可以使用多个值的元组或字典

代码如下:

>>> format="Hello. %s. %s enough for ya?"
>>> values=('world','Hot')
>>> print format % values
Hello. world. Hot enough for ya?

如果需要转换的元组作为转换表达式的一部分存在,那么必须将它用圆括号括起来,以免出错

长字符串、原始字符串
1、长字符串

如果需要写一个非常长的字符串,需要跨多行,则可以使用三个引号代替普通引号

代码如下:

>>> print '''this is
a
very long
string'''
this is
a
very long
string

如果一行之中最后一个字符是反斜线,那么换行符本身就“转义”了,也就是被忽略了

代码如下:

>>> print "hello.\
world!"
hello.world!
>>> #这个用法也适用表达式和语句
>>> 1+2+\
      4+5
12
>>> print \
      'hello.world'
hello.world

2、原始字符串

原始字符串以r开头,可以在原始字符串中放入任何字符,最后输出的字符串包含了转义所用的反斜线,但是不能在字符串结尾输入反斜线:

代码如下:

>>> print \
      'hello.world'
hello.world
>>> print r'Let\'s go!'
Let\'s go!
>>> print r'this is illegal\'
SyntaxError: EOL while scanning string literal

索引与分片

字符串的字符是通过索引来提取的,将获得在特定位置的一个字符的字符串。

Python偏移量是从0开始的,并比字符串的长度小1,还支持类似在字符串中使用负偏移这样的方法从序列中获取元素,负偏移认作是从结束处反向计数

当使用一对冒号分隔的偏移索引字符串这样的序列对象时,将获取从下边界直到但不包括上边界的所有元素

索引(s[i])获取特定偏移的元素:

第一个元素的偏移为0

负偏移索引意味着从最后或右边反向进行计数

s[0]获取第一个元素

s[-2]获取了倒数第二个元素

分片(s[i:j])提取对应的部分作为一个序列:

上边界并不包含在内

分片的边界默认为0和序列的长度,如果没有给出的话

s[1:3]获取从偏移为1的元素,直到但不包括偏移为3的元素

s[1:]获取了从偏移为1直到末尾之间的元素

s[:3]获取了从偏移为0直到但是不包括偏移为3之间的元素

s[:-1]获取了从偏移为0直到但是不包括最后一个元素之间的元素

s[:]获取了从偏移0到末尾之间的元素

代码如下:

>>> s='spam'
>>> s[0],s[-2]
('s', 'a')
>>> s[1:3],s[1:],s[:-1]
('pa', 'pam', 'spa')
>>> s[0],s[-2]
('s', 'a')

扩展分片:第三个限制值

分片表达式增加了一个可选的第三个索引,用作步进X[I:J:K]表示:索引X对象中的元素,从偏移为I直到偏移为J-1,每隔K元素索引一次

代码如下:

>>> s='abcdefghijklmnop'
>>> s[1:10:2]
'bdfhj'
>>> s[::2]
'acegikmo'
>>> s='hello'
>>> s[::-1]
'olleh'
>>> s[4:1:-1]
'oll'

字符串转换工具

代码如下:

>>> '42'+1
Traceback (most recent call last):
  File "<pyshell#40>", line 1, in <module>
    '42'+1
TypeError: cannot concatenate 'str' and 'int' objects
>>> int('42'),str(42)
(42, '42')
>>> repr(42),'42'
('42', '42')
>>> s='42'
>>> i=1
>>> s+i
Traceback (most recent call last):
  File "<pyshell#45>", line 1, in <module>
    s+i
TypeError: cannot concatenate 'str' and 'int' objects
>>> int(s)+i
43
>>> s+str(i)
'421'
>>> #类似也可以把浮点数转换成字符串或把字符串转换成浮点数
>>> str(3.1415),float("1.3")
('3.1415', 1.3)
>>> text='1.23E-10'
>>> float(text)
1.23e-10

字符串代码转换

单个字符也可以通过将其传给内置的ord函数转换为其对应的ASCII码,chr函数则执行相反的操作:

代码如下:

>>> ord('s')
115
>>> chr(115)
's'

字符串方法

字符串比列表的方法还要丰富很多,因为字符串从string模块中“继承”了很多方法,本篇文章只介绍一些特别有用的字符串方法

1、find

find方法可以在一个较长的字符串中查找一个子字符串,它返回子串所在位置的最左端索引,如果没有找到则返回-1

代码如下:

>>> 'with a moo-moo here, and a moo-moo there'.find('moo')
7
>>> title="Monty Python's Flying Cirus"
>>> title.find('Monty')
0
>>> title.find('Python')
6
>>> title.find('Zirquss')
-1

这个方法可以接受可选的起始点和结束点参数:

代码如下:

>>> subject='$$$ Get rich now!!! $$$'
>>> subject.find('$$$')
0
>>> subject.find('$$$',1)
20
>>> subject.find('!!!')
16
>>> subject.find('!!!',0,16)
-1

2、join

join方法是非常重要的字符串方法,它是split方法的逆方法,用来在队列中添加元素:

代码如下:

>>> seq=[1,2,3,4,5]
>>> sep='+'
>>> sep.join(seq)

Traceback (most recent call last):
  File "<pyshell#15>", line 1, in <module>
    sep.join(seq)
TypeError: sequence item 0: expected string, int found
>>> seq=['1','2','3','4','5']
>>> sep.join(seq)
'1+2+3+4+5'
>>> dirs='','usr','bin','env'

>>> '/'.join(dirs)
'/usr/bin/env'
>>> print 'C:'+'\\'.join(dirs)
C:\usr\bin\env

3、lower

lower方法返回字符串的小写字母版

代码如下:

>>> 'HDWUD HDJHS LKJDS'.lower()
'hdwud hdjhs lkjds'

4、replace

replace方法返回某字符串的所有匹配项均被替换后得到字符串

代码如下:

>>> 'This is a test'.replace('is','eez')
'Theez eez a test'

5、split

它是join的逆方法,用来将字符串分割成序列

代码如下:

>>> '1+2+3+4+5'.split('+')
['1', '2', '3', '4', '5']
>>> 'C:\usr\bin\env'.split('/')
['C:\\usr\x08in\\env']
>>> 'Using the default'.split()
['Using', 'the', 'default']

注意:如果不提供任何分隔符,程序会把所有的空格作为分隔符

6、strip

strip方法返回去除两侧(不包含内部)空格的字符串:

代码如下:

>>> '     internal whitespace is kept     '.strip()
'internal whitespace is kept'

也可指定需要去除的字符,将它们列为参数即可:

代码如下:

>>> '*** SPAM * for * everyone!!! ***'.strip(' *!')
'SPAM * for * everyone'

注意:只会去除两侧的字符

7、translate

translate方法和replace方法一样,可以替换字符串中的某些部分,但是和前者不同的是,translate方法只处理单个字符

(0)

相关推荐

  • Python入门篇之条件、循环

    1.if语句 Python 中的if子句看起来十分熟悉. 它由三部分组成: 关键字本身, 用于判断结果真假的条件表达式, 以及当表达式为真或者非零时执行的代码块. if 语句的语法如下: if expression: expr_true_suite if 语句的 expr_true_suite代码块只有在条件表达式的结果的布尔值为真时才执行, 否则将继续执行紧跟在该代码块后面的语句. (1)多重条件表达式 单个if语句可以通过使用布尔操作符and,or和not实现多重判断条件或是否定判断条件.

  • Python入门篇之字典

    字典由多个键及与其对应的值构成的对组成(把键值对成为项),每个键和它的值之间用冒号(:)隔开,项之间用逗号(,)隔开,而整个字典由一对大括号括起来.空字典由两个大括号组成:{} dict函数 可以用dict函数,通过其他映射或者(键,值)这样的序列对建立字典 复制代码 代码如下: >>> items=[('name','Gumby'),('age',42)] >>> d=dict(items) >>> d {'age': 42, 'name': 'Gu

  • 在Python中操作文件之read()方法的使用教程

    read()方法读取文件size个字节大小.如果读取命中获得EOF大小字节之前,那么它只能读取可用的字节. 语法 以下是read()方法的语法: fileObject.read( size ); 参数 size -- 这是可以从文件中读取的字节数. 返回值 此方法返回读取字符串中的字节数. 例子 下面的例子显示了read()方法的使用. #!/usr/bin/python # Open a file fo = open("foo.txt", "rw+") print

  • Python入门篇之字符串

    所有标准的序列操作对字符串都适用,但字符串是不可变的 字符串常量: 单引号:'spa"m' 双引号:"spa'm" 三引号:'''...spam...''',"""...spam...""" 转义字符:"s\tp\na\om" Raw字符串:r"C:\new\test.spm" Unicode字符串:u'eggs\u0020spam 单双引号是一样的 单双引号可以互换,字符常量

  • Python基础篇之字符串的最全常用操作方法汇总

    目录 前言: 字符串的最全常用操作方法 string.capitalize() ​​​​​string.upper() ​​string.lower() string.swapcase() ​​​​​​string.title() ​​​​string.center() string.expandtabs(tabsize = 8) len(string) string.endswith(obj, beg=0, end=len(string)) string.startswith(obj, beg

  • Python入门教程2. 字符串基本操作【运算、格式化输出、常用函数】 原创

    前面简单介绍了Python基本运算,这里再来简单讲述一下Python字符串相关操作 1. 字符串表示方法 >>> "www.jb51.net" #字符串使用单引号(')或双引号(")表示 'www.jb51.net' >>> 'www.jb51.net' 'www.jb51.net' >>> "www."+"jb51"+".net" #字符串可以用"+&

  • Python入门学习之字符串与比较运算符

    Python字符串 字符串或串(String)是由数字.字母.下划线组成的一串字符. 一般记为 : s="a1a2···an"(n>=0) 它是编程语言中表示文本的数据类型. python的字串列表有2种取值顺序: 从左到右索引默认0开始的,最大范围是字符串长度少1 从右到左索引默认-1开始的,最大范围是字符串开头 如果你的实要取得一段子串的话,可以用到变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾. 比如:

  • Python入门篇之函数

    Pythond 的函数是由一个新的语句编写,即def,def是可执行的语句--函数并不存在,直到Python运行了def后才存在. 函数是通过赋值传递的,参数通过赋值传递给函数 def语句将创建一个函数对象并将其赋值给一个变量名,def语句的一般格式如下: 复制代码 代码如下: def function_name(arg1,arg2[,...]):     statement [return value] 返回值不是必须的,如果没有return语句,则Python默认返回值None. 函数名的命

  • Python入门篇之面向对象

    面向对象设计与面向对象编程的关系   面向对象设计(OOD)不会特别要求面向对象编程语言.事实上,OOD 可以由纯结构化语言来实现,比如 C,但如果想要构造具备对象性质和特点的数据类型,就需要在程序上作更多的努力.当一门语言内建 OO 特性,OO 编程开发就会更加方便高效.另一方面,一门面向对象的语言不一定会强制你写 OO 方面的程序.例如 C++可以被认为"更好的C":而 Java,则要求万物皆类,此外还规定,一个源文件对应一个类定义.然而,在 Python 中,类和 OOP 都不是

  • Python入门篇之列表和元组

    列表和元组的主要区别在于,列表可以修改,元组则不能.一般情况下,在几乎所有的情况下列表都可以代替元组 例如:使用序列可以表示数据库中一个人的信息(姓名,年龄) 复制代码 代码如下: >>> edward=['Edward Gumby',42] 序列还可以包含其他序列 复制代码 代码如下: >>> edward=['Edward Gumby',42] >>> john=['John Smith',50] >>> database=[ed

  • Python入门篇之正则表达式

    正则表达式有两种基本的操作,分别是匹配和替换. 匹配就是在一个文本字符串中搜索匹配一特殊表达式: 替换就是在一个字符串中查找并替换匹配一特殊表达式的字符串.   1.基本元素   正则表达式定义了一系列的特殊字符元素以执行匹配动作. 正则表达式基本字符 字符 描述 text 匹配text字符串 . 匹配除换行符之外的任意一个单个字符 ^ 匹配一个字符串的开头 $ 匹配一个字符串的末尾 在正则表达式中,我们还可用匹配限定符来约束匹配的次数.   匹配限定符 最大匹配 最小匹配 描述 * * 重复匹

  • Python入门篇之对象类型

    Python使用对象模型来存储数据.构造任何类型的值都是一个对象 所有的Python对象都拥有三个特性:身份.类型.值 身份: 每一个对象都有一个唯一的身份来标志自己,任何对象的身份可以使用内建函数id()来得到.这个值可以被认为是该对象的内存地址 类型: 对象的类型决定了该对象可以保存什么类型的值,可以进行怎样的操作,以及遵循什么样的规则,可以使用内建函数type()查看Python对象的类型: 复制代码 代码如下: >>> type([1,2]) <type 'list'>

  • Python入门篇之文件

    文件处理的函数和方法 使用Open()函数可打开文件,语法格式如下: 复制代码 代码如下: file_handler = open(filename,[,mode[,bufsize]] filename是你要操作的文件名,如果不在当前路径,需指出具体路径.mode是打开文件的模式,表示你要如何操作文件,bufsize表示是否使用缓存. mode 模式 描述 r 以读方式打开文件,可读取文件信息. w 以写方式打开文件,可向文件写入信息. a 以追加方式打开文件,文件指针自动移到文件尾. r+ 以

随机推荐