Python字符串详细介绍

简介

字符串序列用于表示和存储文本,python中字符串是不可变的,一旦声明,不能改变

通常由单引号(' ),双引号(" ),三引号(''' """)包围

其中三引号可以由多行组成,编写多行文本的快捷语法,常用语文档字符串,在文件的特定地点,被当做注释。便捷的多行注释

Python实际三类字符串:

1.通常意义字符串(str)
2.原始字符串,以大写R 或 小写r开始,r'',不对特殊字符进行转义
3.Unicode字符串,u'' basestring子类
在 Python 中,字符串是“不可改变的序列”

1.不可变

2.满足序列基本操作,按位置存取,切片及索引
字符串
1.获得帮助:

代码如下:

>>> help(str)
>>> dir(str)
>>> help(str.replace)

2.不可变性

在创建之后就不能就地改变(同java),不能通过对其某一位置进行赋值而改变字符划分为不可变序列,这些字符串所包含的字符存在从左到右的顺序,不可在原处修改。python中字符串相当于一个不可变序列的列表,一旦声明,每个字符位置固定

意味着若想改变,必须新建一个!

代码如下:

>>>s='spam'
>>>s[0]='k'   #TypeError
#修改字符串类似java,重新赋值
s = ‘k' + s[1:]

原始字符串

原始字符串常量,r”abcd”,(r/R)即去掉了反斜线转义机制。关闭转义机制,即\不再表示转义

用处:

1.正则表达式

用于处理正则表达式,减少反斜杠

代码如下:

p4search = re.compile(r'\s*')

2.系统路径

可以方便地表示系统路径

代码如下:

path = r'e:\book'

unicode字符串

Unicode是书写国际文本的标准方法。

Python允许你处理Unicode文本——你只需要在字符串前加上前缀u或U。例如,u"This is a Unicode string."

BP: 在你处理文本文件的时候使用Unicode字符串,特别是当你知道这个文件含有用非英语的语言写的文本。

常用操作

1.基本操作

代码如下:

+   :string1+string2    #联接字符串,将后一个串链接到前一个串的后面
    Python不允许在+表达式中出现其他类型,需要手工转【这点不同于java】‘abc'+str(9)
*   :string*n           #创建一个新字符串重复n次原来的串
[]  :string[n]          #从字符串中获取对应位置的一个字符
[:] :string[n:m]        #截取字符串,如果为:m从头到m如果为n:从n到尾
in  :char in string #判断一个字符是否在串中,如果在返回为真(True)
not in :char not in string #判断一个字符是否不在串中,如果在返回为真(True)
r/R : r/Rstring     #禁止转义字符的实际意义,整个字符为原始意义
len() : 长度len(s)

2.类型转换

字符串和数字相互转换

字符串到数字int/float/long

数字到字符串str

代码如下:

>>> int(42)
42
>>> int('42')
42
>>> str(42)
'42'
>>> float('42.0')
42.0
>>> str(42.0)
'42.0'

或者使用string模块的函数

s:进行转换的字符串, base:可选,目标进制

代码如下:

import string
string.atoi(s[,base])   #base默认为10,如果为0,那么s就可以是012或0x23这种形式的字符串,如果是16那么s就只能是0x23或0X12这种形式的字符串


string.atol(s[,base])       #转成long

string.atof(s[,base])       #转成float

字符串和列表的转换
字符串转列表:

代码如下:

s='spam'
l = list(s)

l2 = "hello world".spilt()

列表转字符串

代码如下:

k = ‘'.join(l)

注意,不能join列表中的非字符串

3.修改字符串

代码如下:

s =  s + 'a'
s = s[3:] + ‘b'
s = s.replace(‘pl','pa')

a = '' #赋值空

del a  #整个变量删除

4.索引和分片

索引s[i]

代码如下:

s[0]首个

s[-1] = s[len(s)-1] 倒数第一个

分片s[i:j]

代码如下:

不含上边界,s[1:3] 取[1-2]
s[1:]取1到结束   s[:3] 取开始到2
s[:-1]开始到倒数第二个
s[:]开始到结尾,相当于一个复制
s[1:10:2]  取1-9,步长=2
s[a:b:-2] 步长为负数,两个边界意义反转了,表示从b+1到a,步长-2
s='abcdefg'  
s[5:1:-1] 得到 fedc
s[1:3] == s[slice(1,3)]  内置函数

字符串格式化

这里只介绍基本字符串格式化,扩展在后续篇幅介绍%c 单个字符%d 十进制整数%o 八进制整数%s 字符串%x 十六进制整数,其中字母小写%X 十六进制整数,其中字母大写

代码如下:

>>> str = "so %s a day!"
>>> str % 'beautiful'
'so beautiful a day!'

>>> '{0} is {1}'.format('a','b')
'a is b'

>>> template = "{0}, {1} and {2}"
>>> template.format('a', 'b', 'c')
'a, b and c'

内建函数列表
【字符串方法是python文本处理头号工具】

string.capitalize()
字符串第一个字符大写

string.center(width,[,fill])
原字符居中,空格填充至width长度

string.count(str,beg=0,end=len(string))
获得字符串中某一个子串的数目,计算出现次数,可指定范围

string.decode(encoding='UTF-8',errors='strict')
解码字符串,出错默认报ValueError,除非errors是ignore或replace

string.encode(encoding='UTF-8',errors='strict')
string.endswith(suffix,beg=0,end=len(string))
是否以**结尾

string.expandtabs(tabsize=8)
把字符串中tab转为空格,默认8个

string.find(str,beg=0,end=len(stirng))
检测是否包含str,存在返回开始索引,否则返回-1

string.index(str,begin=0,end=len(string))
同find,不存在报异常,ValueError

string.isalnum()
至少一个字符,且所有字符均为字母或数字,True. 检测字符串是否只包含0-9A-Za-z

string.isalpha()
至少一个字符,所有字符都是字母,True. 检测字符串是否只包含字母

string.isdecimal()
只包含十进制数,True

stirng.isdigit()
只包含数字,True. 检测字符串是否仅包含数字

string.islower()
至少一个区分大小写字符且所有字符小写,True. 检测字符串是否均为小写字母

string.isnumeric()
只含数字字符,True

string.isspace()
只包含空格,True. 检测字符串是否均为空白字符

string.istitle()
标题化字符,True. 检测字符串中的单词是否为首字母大写

string.isupper()
至少一个区分大小写字符且所有字符大写,True. 检测字符串是否均为大写字母

string.join(seq)
以string作为分隔符,seq中所有元素合并为新的字符串. 将原字符串插入参数字符串中的每两个字符之间

string.ljust(width)
返回一个原字符串左对齐,空格补充至长度width

string.lower()
转小写. 将字符串全部转为小写

string.lstrip()
截掉左侧的空格

string.partition(str)
= find+split,从str出现第一个位置,截断为pre_str,str,after_str元组,不含str则pre_str=strstring.replace(str1,str2,num=string.count(str1))替换,指定不超过num次,可作为模板实现

string.rfind(str,beg=0,end=len(string))
同find,右边开始

string.rindex(str,beg=0,end=len(string))
同index,右边开始

string.rjust(width)
右对齐,空格补齐

string.rpartition(str)
同partition,右边开始

string.rstrip([chars])
清理右侧空白,包括换行符,返回处理后字符串

string.split(str=””, maxsplit =string.count(str))
以str切片,可指定分割次数, 分割字符串,返回列表,默认分隔符空格

string.splitlines(num=string.count(‘\n'))
s.splitlines([keepends])按行分隔,可指定分割次数

string.startswith(obj,beg=0,end=len(string))
以str开头,True. 检测字符串是否以某一子串开头

string.strip([obj])
在string上执行lstrip和rstrip

string.swapcase
反转string中大小写. 字符串中小写转大写,大写转小写

string.title()
标题花,单词首字母大写,其余小写

string.translate(str,del=””)
s.translate(table)根据str给出表转换string字符,要过滤的字符放在del参数中

string.upper()
转大写. 将字符串全部转为大写

string.zfill(width)
返回长度width的字符串,原字符串右对齐,前面填充0

len(string)
获取字符串的长度

最佳实践

1.循环中用到长度

代码如下:

while i < len(stri):
#修改
size = len(stri)
while i < size

2.字符串追加

代码如下:

l = ['a', 'b']
result = ''
for i in l:
    result += i
#修改
result = ''.join(l)

其他
1.转义符

几个常用:

\n换行,\\反斜杠
\t制表  \'单引号
\r回车 \"双引号

后续需扩展

字符串编码详解
字符串格式化
正则表达式
字符串涉及常用模块(序列化/文本包装等)

(0)

相关推荐

  • Python字符串替换实例分析

    本文实例讲述了Python字符串替换的方法.分享给大家供大家参考.具体如下: 单个字符替换 s = 'abcd' a = ["a", "b", "c"] b = ["c", "d", "e"] import string s.translate(string.maketrans(''.join(a),''.join(b))) print s 输出结果为:abcd 字符串替换,改善版 s

  • python中常用检测字符串相关函数汇总

    本文实例汇总了python中常用检测字符串相关函数.分享给大家供大家参考.具体分析如下: 下面的python代码可用于检测字符串,包括是否全部为数字,是否包含数字,是否包含标题单词,是否包含大写字母,是否包含小写字母,是否包含空格,是否以指定的字符开头和结尾. my_string = "Hello World" my_string.isalnum() #检测所有字符是否都是数字 my_string.isalpha() #检测字符串中的所有字符是否都是字母 my_string.isdig

  • Python 字符串操作实现代码(截取/替换/查找/分割)

    Python 截取字符串使用 变量[头下标:尾下标],就可以截取相应的字符串,其中下标是从0开始算起,可以是正数或负数,下标可以为空表示取到头或尾. 复制代码 代码如下: # 例1:字符串截取str = '12345678'print str[0:1]>> 1   # 输出str位置0开始到位置1以前的字符print str[1:6]  >> 23456   # 输出str位置1开始到位置6以前的字符num = 18str = '0000' + str(num) # 合并字符串pr

  • python写入中英文字符串到文件的方法

    本文实例讲述了python写入中英文字符串到文件的方法.分享给大家供大家参考.具体分析如下: python中如果使用系统默认的open方法打开的文件只能写入ascii吗,如果要写入中文需要用到codecs模块,下面的代码向 c:/1.txt文件写入 "你好,我们 jb51.net"中文字符串 # -*- coding: utf-8 -*- import codecs content = u'你好,我们 jb51.net' f = codecs.open('c:/1.txt','w','

  • python实现指定字符串补全空格的方法

    本文实例讲述了python实现指定字符串补全空格的方法.分享给大家供大家参考.具体分析如下: 如果希望字符串的长度固定,给定的字符串又不够长度,我们可以通过rjust,ljust和center三个方法来给字符串补全空格 rjust,向右对其,在左边补空格 s = "123".rjust(5) assert s == " 123" ljust,向左对其,在右边补空格 s = "123".ljust(5) assert s == "123

  • 详解Python当中的字符串和编码

    字符编码 我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节.比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295. 由于计算机是美国人发明的,因此,最早只有1

  • python字符串替换的2种方法

    python 字符串替换 是python 操作字符串的时候经常会碰到的问题,这里简单介绍下字符串替换方法. python 字符串替换可以用2种方法实现: 1是用字符串本身的方法. 2用正则来替换字符串 下面用个例子来实验下: a = 'hello word' 把a字符串里的word替换为python 1.用字符串本身的replace方法 复制代码 代码如下: a.replace('word','python') 输出的结果是hello python 2.用正则表达式来完成替换: 复制代码 代码如

  • python字符串替换示例

    php5.2升级到5.3后,原& new的写法已经被放弃了,可以直接new了,面对上百个php文件,手动修改简直是想要命,所以写了个脚本,分分钟搞定. 复制代码 代码如下: #-*- coding:utf-8 -*- #!/usr/bin/python import os #定义程序根目录rootpath='D:\\wamp\\www\\erp\\app' def m_replace(path): for item in os.listdir(path):  nowpath=os.path.jo

  • Python字符串详细介绍

    简介 字符串序列用于表示和存储文本,python中字符串是不可变的,一旦声明,不能改变 通常由单引号(' ),双引号(" ),三引号(''' """)包围 其中三引号可以由多行组成,编写多行文本的快捷语法,常用语文档字符串,在文件的特定地点,被当做注释.便捷的多行注释 Python实际三类字符串: 1.通常意义字符串(str) 2.原始字符串,以大写R 或 小写r开始,r'',不对特殊字符进行转义 3.Unicode字符串,u'' basestring子类 在 Py

  • Python 编程语言详细介绍

    目录 一.语法 1.缩进 2.变量 3.表达式 4.类型 5.方法 二. 库 1.Python的应用 3.值得学习Python吗? 前言: Python是世界上最流行的解释型编程语言之一.Python 由 Guido van Rossum 设计,作为"ABC"编程语言的继承者,于 1991 年首次发布.它是一种高级通用语言,其设计理念是通过使用缩进来强调代码的可读性.Python 的语言结构旨在帮助程序员为小型和大型项目编写逻辑代码. 该语言是动态类型的,支持多种编程范式.它完全支持面

  • Python 转义字符详细介绍

    Python 转义字符 在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符.如下表: 原始字符串 有时我们并不想让转义字符生效,我们只想显示字符串原来的意思,这就要用r和R来定义原始字符串.如: print r'\t\r' 实际输出为 "\t\r" 转义字符 描述 \(在行尾时) 续行符 \\ 反斜杠符号 \' 单引号 \" 双引号 \a 响铃 \b 退格(Backspace) \e 转义 \000 空 \n 换行 \v 纵向制表符 \t 横向制表符 \r 回车

  • Python pass详细介绍及实例代码

    Python pass的用法: 空语句 do nothing 保证格式完整 保证语义完整 以if语句为例,在c或c++/Java中: if(true) ; //do nothing else { //do something } 对应于Python就要这样写: if true: pass #do nothing else: #do something 1 pass语句在函数中的作用 当你在编写一个程序时,执行语句部分思路还没有完成,这时你可以用pass语句来占位,也可以当做是一个标记,是要过后来

  • 对Python字符串中的换行符和制表符介绍

    有关换行的问题 首先提一个问题,如下. python程序代码如下: print("I'm Bob. What's your name?") 上一行代码的输出如下: I'm Bob. What's your name? 上面的输出没有换行.想在What之前换行,效果是: I'm Bob. What's your name? 该怎么办? 在What之前敲回车,行吗?不行,这个回车的效果是语句换行,不是输出内容换行. 用换行符的解决办法 上述问题的解决办法是在What之前插入换行符.写法是:

  • Python字符串与正则表达式详细介绍

    目录 一.字符串相关操作 二.正则表达式相关操作 一.字符串相关操作 1.统计所输入字符串中单词的个数,单词之间用空格分隔.其运行效果如下图所示. s=input('请输入字符串:') sum=1 for i in s:     if i==' ':         sum+=1 print('方法一:',end='') print('其中的单词总数有:',sum)   list=s.split(' ') print('方法二:',end='') print('其中的单词总数有:',len(li

  • python正则表达式re模块详细介绍

    本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一样漂亮. 正则表达式使用反斜杆(\)来转义特殊字符,使其可以匹配字符本身,而不是指定其他特殊的含义.这可能会和python字面意义上的字符串转义相冲突,这也许有些令人费解.比如,要匹配一个反斜杆本身,你也许要用'\\\\'来做为正则表达式的字符串,因为正则表达式要是\\,而字符串里,每个反斜杆都要写成\\. 你也可以在字符串前加上

  • Python 模块EasyGui详细介绍

    Python 模块EasyGui详细介绍 前言: 在Windows想用Python开发一些简单的界面,所以找到了很容易上手的EasyGui库.下面就分享一下简单的使用吧. 参考的链接:官网Tutorial 接下来,我将从简单,到复杂一点点的演示如何使用这个模块.希望能给刚接触easygui的你一点帮助 :-) msgBox,ccbox,ynbox # coding:utf-8 # __author__ = 'Mark sinoberg' # __date__ = '2016/5/25' # __

  • Json对象和字符串互相转换json数据拼接和JSON使用方式详细介绍(小结)

    JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.它基于ECMAScript的一个子集. JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C.C++.C#.Java.JavaScript.Perl.Python等).这些特性使JSON成为理想的数据交换语言. 易于人阅读和编写,同时也易于机器解析和生成(一般用于提升网络传输速率). 一.JSON字符串转换为JSON对象: eval() 和 JSON.parse eg- js

  • Python字典操作详细介绍及字典内建方法分享

    创建 方法一: >>> dict1 = {} >>> dict2 = {'name': 'earth', 'port': 80} >>> dict1, dict2 ({}, {'port': 80, 'name': 'earth'}) 方法二:从Python 2.2 版本起,可以使用一个工厂方法,传入一个元素是列表的元组作为参数 >>> fdict = dict((['x', 1], ['y', 2])) >>> f

随机推荐