浅析Python字符串索引、切片、格式化

目录
  • 1 字符串索引
    • 1.1 循环索引字符
  • 2 字符使用
    • 2.1 字符串运算
  • 3 字符串切片
    • 3.1 切片方法
  • 4 字符串格式化

除了数字,Python中最常见的数据类型就是字符串,无论那种编程语言,字符串无处不在。例如,从用户哪里读取字符串,并将字符串打印到屏幕显示出来。 字符串是一种数据结构,这让我们有机会学习索引和切片——用于从字符串中提取子串的方法。

1 字符串索引

在Python语法支持中,我们简单的阐述过字符串的使用,现在我们看看python程序在处理字符串时,如何对其进行索引,打印出其中的每个字符串。我们输入一个字符串:'你好,Lucky',Python使用方括号 [] 来对字符串进行索引,方括号内的数字 0~n 表示将要获取的字符串,如图1-1所示,sting[0~7]分别对应不同的值,最小的字符换索引为0,最大的字符串索引比字符串长度小1。

如果 string 指向一个长度为 n 的字符串, 则 string[0] 为第一个字符,string[1] 为第二个字符, string[2] 为第三个字符,依此类推。string[n-1] 为最后一个字符。

当然,在上面的示例中,string[8]索引超出了字符串的末尾,导致的错误提示,这点需要注意。Python索引为何从0开始?我们这样理解便可: 索引值用于测量与字符串第一个字符相隔的距离, 就像一把尺子(其刻度也是从零开始)。这 让有些索引计算更简单,也与函数 %(求余) 一致。% 经常用于索引计算,自然也可能返回 0。

实际应用中,往往不会只用到正向索引(本文理解从左向右),当你需要访问字符串的最后一个字符时,也可以使用正向表达式,但字符串过长时明显不便,所以Python提供了一种方面的索引方式:从右向左(负数索引)来表示。如下:字符串的最后一个字符为 string[-1],其索引过程即可按照图1-1进行修改,此处不做阐述。

1.1 循环索引字符

假如需要依次访问字符串的每个字符,需要计算出所给字符串的编码总和,对比两种代码方法,如下图实现及结果,第一种codesum1()函数: 使用 for 循环时,在循环的每次迭代开头,都会将循环变量 c 设置为 s 中的 下一个字符。使用索引访问 s 中字符的工作由 for 循环自动处理。

第二种codesum2()函数使用了常规访问s中字符的方法,对比codesum1()函数可以发现,虽然二者计算结果一致,但第二种函数的代码明显较为复杂,理解程度上稍微差一些。当然,这是多数人的理解,有些人可能觉得第二种实现更好一些。

def codesum1(s):
    total = 0
    for c in s:
        total = total + ord(c)
    return total

def codesum2(s):
    total = 0
    for i in range(len(s)):
        total = total + ord(s[i])
    return total

2 字符使用

在所有编程语言中,字符串都是由字符所组成,而所有字符都有对应的字符编码与之相对应。在Python中,我们可以使用ord()函数来学习。ord() 函数是 chr() 函数(对于8位的ASCII字符串)或 unichr() 函数(对于Unicode对象)的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的 ASCII 数值,或者 Unicode 数值,如果所给的 Unicode 字符超出了你的 Python 定义范围,则会引发一个 TypeError 的异常。

关于Unicode做一个简单的背景介绍: Unicode 提供了一个大得多的字符编码集。出于方便考虑,Unicode 的前 256 个 字母为 ASCII 码,因此如果你只处理英文字符,几乎不用考虑 Unicode 的细节。

>>> ord('a')
97
>>> ord('b')
98
>>> ord('c')
99

给定字符编码,可使用函数 chr 来获悉对应的字符:

>>> chr(99)
'c'
>>> chr(98)
'b'
>>> chr(97)
'a'

字符编码是根据Unicode分配的,而Unicode是一个庞杂的编码标准,涵盖了全球各种语言中的符号和字符,使用十分广泛 。并非所有字符都有可视的标准符号。例如,换行字符、回车字符和制表符都是不可见的,虽然它们带来的效果可见。这些字符属于空白字符——在印刷页面上显示为空白。 如下表:

其它的字符以普通格式输出

举两个个简单的常用示例:

1. 在 Python 中,表示换行的标准方式是使用字符 \n:

2. 在字符串中包含反斜杠、单引号和双引号,通常需要使用对应的转义字符:

转义字符是单个字符, 为让 Python 知道下一个字符是特殊字符, 必须使用 \,但在计算字符串的长度时,并不将 \ 视为额外的字符。例如:

在使用转义字符时,还有一点需要特别注意的是:在表示文本行末尾方面,不同操作系统遵循的标准是不同的。Windows 使 用 \r\n 表示行尾,OS X 和 Linux 使用 \n, 而 OS X 之前的 Mac 操作系统使用 \r。

2.1 字符串运算

数字有其标准的运算方式,字符串同样也有着一定的运算。下面来看下字符串的运算符。

示例 :

1.x和y分别赋值字符串;

>>> x = "I am coming"
>>> y = "Python Language"

3 字符串切片

在 Python 中,可使用切片从字符串中提取子串。要对字符串执行切片操作,可指定两个索引:要提取的第一个字符的索引;要提取的最后一个字符的索引加 1。例如:

用于切片的索引与用于访问各个字符的索引相同:第一个索引总是为零,而最后一个索引总是比字符串长度小 1。一般而言,string[begin:end]返回从索 引 begin 到 end-1 的子串。注意:如果 string 是一个字符串,则要访问索引 i 对应的字符,可使用 string[i] 或 string[i:i+1]。

3.1 切片方法

如果想要省略字符串的起始索引,Python将假定为0;如果需要省略字符串的终止索引,Python 会假设你要提取到字符串末尾。

实用示例:取值文件名中的扩展名。

def get_ext(fname):
    dot = fname.rfind('.')
    if dot == -1: # fname 中没有
        return ''
    else:
        return fname[dot + 1:]

注意第一处标红需要加引号好,第二处输入的文件名没有扩展名,故没有返回值。该函数的实现过程:确定最右边的 '.' 的索引(因此使用 rfind 从右往左查 找);如果 fname 不包含 '.',则返回一个空字符串,否则返回 '.' 后面的所有字符。

在索引字符串时所讲述的正向、负向索引同样可以应用于切片中。

使用负数索引时,这样做通常会有所帮助:将字符串写到纸上,再标出每个字符的正索引和负索引,就像图 1-1 那样。虽然这样做确实需要多用一两分钟时间,但可以很好地避免常见的索引错误。

4 字符串格式化

Python 支持格式化字符串的输出 。这会用到一个较为复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。

>>> print("我最喜欢的食物是%s,它的热量是%d千焦" %('hot dog',3500))
我最喜欢的食物是hot dog,它的热量是3500千焦

我们将python字符串格式化符号整理如下:标红为字符串格式化中的辅助指令

示例:

对于Python字符串格式化的输出,可以通过上述几个例子体验一下字符串区别与基本使用。Python本身已经自带了许多很有用的函数模块,简化了字符串的使用,增强了其功能。后面,我们会对Python的字符串函数以及正则使用做较为详细的阐述。

到此这篇关于浅析Python字符串索引、切片、格式化的文章就介绍到这了,更多相关Python字符串内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • 详解Python字符串切片

    在python中,我们定义好一个字符串,如下所示. 在python中定义个字符串然后把它赋值给一个变量. 我们可以通过下标访问单个的字符,跟所有的语言一样,下标从0开始(==,我自己都觉得写的好脑残了) 这个时候呢,我们可以通过切片的方式来截取出我们定义的字符串的一部分. 使用切片的时候我们有两种方式: 1.没有步长的简单切片 语法格式是这样的: 1.首先定义一格字符串,比如叫 Hebe,然后给它赋值 2. 截取字符串中的一部分,我们用的语法是 Hebe [ start : stop ] 注意一

  • Python 字符串操作详情

    目录 1.字符串的定义 2.转义字符串和原始字符串 4.字符串的运算 4.1 拼接运算符 4.2 成员运算 5.获取字符串长度 6.索引和切片 7.字符串的方法 7.1 转换大小写 7.2 查找操作 7.3性质判断 7.4格式化字符串 8.修剪操作 1.字符串的定义 所谓字符串,就是由0个或者多个字符组成的有限序列. 在Python程序中,如果我们把单个或多个字符用单引号''或者双引号""包裹起来,就可以表示一个字符串,也可以用三个单引号或者双引号进行折行.字符串的字符可以是特殊符号.

  • Python中字符串切片详解

    目录 1.没有步长的简单切片 2.有步长的切片方式 在python中,我们定义好一个字符串,如下所示. 在python中定义个字符串然后把它赋值给一个变量.我们可以通过下标访问单个的字符,跟所有的语言一样,下标从0开始.这个时候呢,我们可以通过切片的方式来截取出我们定义的字符串的一部分.使用切片的时候我们有两种方式:没有步长的简单切片和有步长的切片方式 1.没有步长的简单切片 语法格式是这样的: 首先定义一格字符串,比如叫s,然后给它赋值 截取字符串中的一部分,我们用的语法是 s[ start:

  • python 字符串详解

    目录 一.字符串: 二.使用: (1)空字符串和 len( ) 函数 (2)转译字符( \ ) (3)字符串拼接 (4)字符串复制 (5)不换行打印 (6)从控制台读取参数: (7)str() 实现数字转型字符串 (8)[ ] 提取字符 (9)replace(source,str) 实现字符串替换 (10)字符串切片 slice 操作,截取字符串 (11)split() 分割和 join() 合并 (12)字符串驻留机制和字符串比较 三.其他: 总结 一.字符串: python的字符串是不可变的

  • python 字符串格式化的示例

    一.旧式的字符串格式化 % 操作符 参考以下示例: >>> name = "Eric" >>> "Hello, %s." % name 'Hello, Eric.' 当有多个变量需要插入到字符串中时: >>> name = "Eric" >>> age = 74 >>> "Hello, %s. You are %s." % (name,

  • python字符串操作

    目录 一.字符串方法 1.字符串的分割 2.字符串的查找,替换 3.字符串的判断 二.切片操作(列表,元组也可以) 1.索引 2.切片有三个参数[start:end :step] 一.字符串方法 1.字符串的分割 s.split() 默认是按照空格分割 s.split(',') 按照逗号分割(返回的是一个列表,并没有改变原来的字符串) >>> s= "如今最好,别说来日方长,时光难留,只有一去不返" >>> print(s.split(",

  • Python学习之字符串格式化

    目录 一.这种占位符有很多 二.具体的使用方式 1.可以一次多插入几个数值 2.打印浮点数(小数) 3.打印百分数 4.调用字典进行拼接 5.sep 设置分割符号 6.flags 格式符号 三.format 1.默认使用 拼接 2.使用索引以及切片进行拼接 3.调用元祖进行拼接 4.使用字典作为format的元素库 5.使用列表作为format的元素库 6.占位计算符 总结 字符串拼接 %s % (%s表示将插入一个字符串类型的数据 str) 就相当于 %s 是一个占位符,而句子后面的 %后面就

  • 浅析Python字符串索引、切片、格式化

    目录 1 字符串索引 1.1 循环索引字符 2 字符使用 2.1 字符串运算 3 字符串切片 3.1 切片方法 4 字符串格式化 除了数字,Python中最常见的数据类型就是字符串,无论那种编程语言,字符串无处不在.例如,从用户哪里读取字符串,并将字符串打印到屏幕显示出来. 字符串是一种数据结构,这让我们有机会学习索引和切片--用于从字符串中提取子串的方法. 1 字符串索引 在Python语法支持中,我们简单的阐述过字符串的使用,现在我们看看python程序在处理字符串时,如何对其进行索引,打印

  • Python字符串三种格式化输出

    字符串格式化输出是python非常重要的基础语法,今天就把三种格式化输出做一个简单的总结,希望对大家有帮助. 格式化输出:内容按照一定格式要求进行输出. 1.使用占位符%输出 python2.6版本之前,使用%格式化字符串沿用的是C语言的输出格式. 使用说明: print("格式化字符串" % 变量) #变量超过2个使用元组格式: print("格式化字符串" % (变量1,变量2)) 使用%占位符表示字符串中变量位置. 传入的值要与%占位符的变量一一对应. 其中,

  • 浅析python字符串前加r、f、u、l 的区别

    先给大家介绍下Python 字符串前面加u,r,b,f的含义(字符串前缀) 1.字符串前加 u 例:u"我是含有中文字符组成的字符串." 作用: 后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码. 2.字符串前加 r 例:r"\n\n\n\n" # 表示一个普通生字符串 \n\n\n\n,而不表示换行了. 作用: 去掉反斜杠的转移机制. (特殊字符:即那些,反斜杠加上对应字母,表示对应的特殊含义的

  • 浅析Python字符串中的r和u的区别

    目录 1.r(R) 2.u(U) 补充 参考文献 Python中字符串前面我们经常看到加r(R)或u/(U)的前缀,而这两个符号是什么意思呢? 1.r(R) r意为raw,表示不包含转义字符的原生字符串.常见的转义字符包括下列几种: 转义字符 描述 \(在行尾时) 续航符 \\ 反斜杠符号 ' 单引号(字符串需要为""形式) " 双引号(需要字符串用需要为''形式) \b 退格(Backspace) \000 空 \n 换行 \v 纵向制表符 \t 横向制表符 下面是几个转义

  • Python字符串类型及格式化问题

    目录 一.字符串类型 二.字符串类型 三.字符串的索引 四.字符串的切片 五.format()方法的基本使用 六.format()方法的格式控制 总结 一.字符串类型 1)字符串是字符的序列表示,根据字符的内容分为单行字符串和多行字符串. 2)单行字符串可以由一对单引号(’)或双引号(“)作为边界来表示,单引号和双引号作用相同 3)多行字符串可以由一对三单引号(''')或三双引号(""")作为边界来表示,两者作用相同. 二.字符串类型 1)Python语言转义符:\ eg:\

  • Python字符串的索引与切片

    目录 1.字符串的索引与获取 2.字符串的 find 与 index 函数 1.字符串的索引与获取 字符串的索引方式与列表的索引方式是一样的.只不过列表是每个元素的自身就有一个索引位置,而字符串是每个字符就有一个索引位置. 索引规则与列表相同 切片和索引的获取与列表相同 无法通过索引进行修改和删除操作(字符串不可修改) 示例如下: name = 'Adem' print(name[0]) print(name[-1])  执行结果如下: >>> A>>> m 2.字符串

  • Python 字符串、列表、元组的截取与切片操作示例

    本文实例讲述了Python 字符串.列表.元组的截取与切片操作.分享给大家供大家参考,具体如下: demo.py(字符串.列表.元组的截取): # 切片(截取) [开始索引:结束索引:步长] 步长默认为1 结束索引默认截取到末尾 # 字符串的截取 print("012345"[1:3]) # 12 # 列表的截取 print([0,1,2,3,4,5][1:3]) # [1, 2] # 元组的截取 print((0,1,2,3,4,5)[1:3]) # (1, 2) # 字典的元素是无

  • Python 中pandas索引切片读取数据缺失数据处理问题

    引入 numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? numpy能够帮我们处理处理数值型数据,但是这还不够 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等 比如:我们通过爬虫获取到了存储在数据库中的数据 比如:之前youtube的例子中除了数值之外还有国家的信息,视频的分类(tag)信息,标题信息等 所以,numpy能够帮助我们处理数值,但是pandas除了处理数值之外(基于numpy),还能够帮助我

  • 浅析Python数字类型和字符串类型的内置方法

    一.数字类型内置方法 1.1 整型的内置方法 作用 描述年龄.号码.id号 定义方式 x = 10 x = int('10') x = int(10.1) x = int('10.1') # 报错 内置方法 没有内置方法,只有算术运算和比较运算 存在一个值还是多个值 存一个值 有序or无序 有序:有索引:无序:无索引 压根就没有这一说 可变or不可变(重点) 数字类型不可变 可变(变量值而言) lis = [1,2,3] print(id(lis)) lis[0] = 2 #lis-->[2,2

随机推荐