详解Python3.1版本带来的核心变化

这里我们将对Python 3.1核心语言的变化进行分析,包括字符串的格式化、说明符以及其他方面的内容。希望这些变化能对大家了解Python 3.1有所帮助。

Python 3.0发布七个月之后,Python核心开发人员于2009年6月27日发布了新的Python 3.1版本。虽然此3.1版本只是对Python 3.0的一次小型升级,但是它不仅为开发者带来许多让人感兴趣的特性,同时在性能方面也有所改善。本文将为读者详细介绍Python 3.1版本在核心语言、标准程序库和性能改善方面的变化。

一、字符串的格式化

Python的最新版本为我们带来了讨人喜欢的格式字段的自动填数功能。我们知道,许多程序中经常需要格式化字符串。Python 2.x版本使用的是类似[s]printf函数的百分号操作符,如下所示:

  >>> '%s, %s!' % ('Hello', 'World')

'Hello, World!'而Python 3.0则添加了更高级的字符串格式化功能,如下所示:

  >>> '{0}, {1}!'.format('Hello', 'World')

'Hello, World!'如今,Python 3.1则在字符串格式化方面又有了新的改进。对于Python 3.0来说,每当您想在格式串中引用位置参数时,您必须给出每个位置参数的索引。但是在Python 3.1中,您就可以将这些索引抛在脑后了,因为Python会依次替您填充这些参数:

  >>> '{}, {}!'.format('Hello', 'World')
  'Hello, World!'

二、PEP-378:用于千位分隔符的格式说明符

在财务应用程序中,通常要在数字中使用千位分隔符。从事金融或者财会方面工作的人士是不这样写的“您欠我$12345678”,而是“您欠我$12,345,678”,他们惯于使用逗号作为分隔符。那么,如何使用Python达到这种效果呢:

  >>> format(12345678, ',')

'12,345,678'您可以利用其他区分符对数字进行分组。这里的宽度说明符(这里为8)包括了逗号和小数点:

  >>> format(1234, ',').replace(',', '_')

'12,345.7'逗号通常作为默认的分隔字符,如果要使用其他字符作为分隔字符的话,只需通过replace函数用您喜欢的字符替换逗号即可,具体如下所示:

  >>> format(1234, ',').replace(',', '_')

'1_234'当然,您还可以使用format函数来作为字符串方法:

>>> '{0:8,.1f}'.format(123.456)

三、Maketrans函数

利用maketrans()和translate()函数,我们可以使用一组字符来替换另一组字符。使用这一替换功能时,多少有点繁琐,因为它要求使用maketrans()函数(该函数的作用是把输入字符映射到输出字符)建立一个转换表,然后,再把这个转换表传递给translate()函数。当然,string模块仍然有它自己的maketrans()函数,不过Python 3.1不赞成使用它,而是赞赏使用单独的maketrans()函数来操作字节、字节数组和字符串。

下面的例子演示了如何使用maketrans()和translate()函数处理字节对象。需要注意的是,用于字节的转换表具有256个表项(每一项对应于一个可能的字节),并且这个例子把大部分字节都映射到它们自身,只有1,2和3例外,因为它们分别映射到了4,5和6。如下所示:

  >>> tt = bytes.maketrans(b'123', b'456')
  >>> len(tt)
  256
  >>> tt
  b'\x00\x01\x02\x03\x04\x05\x06\x07\x08\
  t\n\x0b\x0c\r\x0e\x0f\x10\x11\x12\x13\
  x14\x15\x16\x17\x18\x19\x1a\x1b\x1c\x1d\
  x1e\x1f !"#$%&\'()*+,-./0456456789:;<=>
  ?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\\]^_`abcd
  efghijklmnopqrstuvwxyz{|}~\x7f\x80\x81\
  x82\x83\x84\x85\x86\x87\x88\x89\x8a\x8b\
  x8c\x8d\x8e\x8f\x90\x91\x92\x93\x94\x95\
  x96\x97\x98\x99\x9a\x9b\x9c\x9d\x9e\x9f\
  xa0\xa1\xa2\xa3\xa4\xa5\xa6\xa7\xa8\xa9\
  xaa\xab\xac\xad\xae\xaf\xb0\xb1\xb2\xb3\
  xb4\xb5\xb6\xb7\xb8\xb9\xba\xbb\xbc\xbd\
  xbe\xbf\xc0\xc1\xc2\xc3\xc4\xc5\xc6\xc7\
  xc8\xc9\xca\xcb\xcc\xcd\xce\xcf\xd0\xd1\
  xd2\xd3\xd4\xd5\xd6\xd7\xd8\xd9\xda\xdb\
  xdc\xdd\xde\xdf\xe0\xe1\xe2\xe3\xe4\xe5\
  xe6\xe7\xe8\xe9\xea\xeb\xec\xed\xee\xef\
  xf0\xf1\xf2\xf3\xf4\xf5\xf6\xf7\xf8\xf9\
  xfa\xfb\xfc\xfd\xfe\xff'

建好转换表之后,我们只需把它传递给translate()函数即可,如下所示:

  >>> b'123456'.translate(tt)

b'456456'我们还可以传递其它的参数作为要删除的字符:

  >>> b'123456'.translate(tt, b'5')

b'45646'我们可以看到,原来的5已经从123456从删掉了,但是转换得到的5(请记住,我们的映射表将2转化为5)并没有删除。这说明,系统是先从原来的字符串中删除相应的字符,然后才进行的转换操作。
字符串的转换稍微有些不同,字符串版本的maketrans函数返回的是一个字典:

  >>> tt = str.maketrans('123', '456')
  {49: 52, 50: 53, 51: 54}
  >>> '123456'.translate(tt)
  '456456'

四、与数学有关的变化

  >>> int.bit_length(19)
  5
  >>> bin(19)

3.1版本在与数学有关的方面也有所改变。

Int添加了一个bit_length方法

新版本中,int变量具有一个bit_length方法,它能返回该int变量以二进制数表示的时候的位数。例如,数字19的二进制表示为10011,那么它的位数就是5:

'0b10011'浮点数的舍入

在Python 3.0以及早先的round()函数有点反复无常:如果您不指定精度的时候,它返回的是一个整数;如果指定精度的话,它返回的是您输入数据的类型:

  >>> round(1000)
  1000
  >>> round(1000.0)
  1000
  >>> round(1000, 2)
  1000
  >>> round(1000.0, 2)

1000.0在Python 3.1中,只要输入的数字是一个整数(即使它是用浮点数的形式表示的,例如1000.0),那么它总是返回一个整型数:

  >>> round(1000)
  1000
  >>> round(1000.0)
  1000
  >>> round(1000, 2)
  1000
  >>> round(1000.0, 2)

1000浮点数的表示

目前,实数在大部分的硬件和操作系统中都是用32位(单精度)或者64位(双精度)来表示的。然而,这会导致一些实数无法精确表示。由于计算机存储器的二进制特性,某些数字利用十进制表示形式非常简洁,但是要是使用浮点方案表示的话,就要复杂了。举例来说,利用32位的单精度浮点数表示数字0.6,则为0.59999999999999998:

>>> 0.6

0.59999999999999998对于这种表示方案,上面的数字是为了做到尽可能的精确,但是对用户来说却很不友好。 Python 3.1使用了一个新算法,以便使得原值的表示尽可能得简练。所以在Python 3.1中,人们输入上面的数字,一个更简洁的表示:

>>> 0.6

0.6这已经很精确了,除非遇到算术运算。举例来说,表达式0.7+0.1的值用32位浮点表示法表示的话,它是 0.79999999999999993,而数字0.8的值用32位浮点数表示则是 0.80000000000000004。 这样一来,就意味着0.7+0.1并不等于0.8,这会导致一些问题。例如,下面的循环将永不休止:

  >>> x = 0.0
  >>> while x != 1.0:
  ... print(repr(x))
  ... x += 0.1输出的结果:
  0
  0.10000000000000001
  0.20000000000000001
  0.30000000000000004
  0.40000000000000002
  0.5
  0.59999999999999998
  0.69999999999999996
  0.79999999999999993
  0.89999999999999991
  0.99999999999999989
  1.0999999999999999
  1.2
  1.3
  1.4000000000000001
  1.5000000000000002
  1.6000000000000003

...在Python 3.0中,repr()函数返回的是实际表示;而在Python 3.1中,它返回的是简洁表示。无论是在Python 3.0还是在Python 3.1中,print()函数显示的都是简洁表示:

  >>> print(0.1)
  0.1
  >>> print(0.10000000000000001)

0.1Python语言还有一个称为decimal的模块,可用于精确的实数表示。它使用一个不同的表示方案来表示浮点数,并且在内存运行的情况下,用尽量多的数位来表示一个实数——并且,当进行算术的时候不会出现舍入误差。在Python 3.0中,Decimal类型使用了一种新方法来从一个字符串初始化它表示的值;在Python 3.1中,又增加了另一个新方法即from_float()来接收浮点数。注意,即使当使用from_float()的时候,Decimal模块也会比32位更精确。

  >>> from decimal import Decimal
  >>> Decimal.from_float(0.1)
  Decimal('0.1000000000000000055511151231257827021181583404541015625')

五、改进的WITH语句

在Python 2.5中,WITH语句是作为一个__future__特性引入的,该语句的正式引入实际上是从Python 3.0开始的。到了Python 3.1版本,该语句已经能够支持更多的资源。最常见的情形是,它可以打开输入、输出文件并在处理完成后关闭它们。在Python 3.0中,我们要么使用嵌套的with语句,要么显式闭合在文件中。下面是一个Python 3.0的例子,它打开了一个输入文件,将其内容作为字符串读取,用字符串的title()方法处理内容,并将结果写到一个输出文件中。
这个示例中含有两个嵌套的with语句,注意嵌套的with语句中的最后一行。当代码试图读取out.txt的时候,结果为空,因为此文件是被缓冲处理的,并且还没有写入。当此with语句完成的时候,Python会关闭此文件,所以最后一行代码会认定out.txt的内容的确是大写文字。

  open('in.txt', 'w').write('abc def')
  with open('in.txt') as in_file:
  with open('out.txt', 'w') as out_file:
  text = in_file.read()
  assert text == 'abc def'
  text = text.title()
  assert text == 'Abc Def'
  out_file.write(text)
  assert open('out.txt').read() == ''

assert open('out.txt').read() == 'Abc Def'看到嵌套的with语句,是不是感觉有点头疼,呵呵。接下来,我们要打开两个两个文件,并在处理完成后关闭它们(如果您需要打开三个文件,那么就需要三个嵌套的with语句)。 Python 3.1运行您使用单个WITH语句打开所有文件:

  open('in.txt', 'w').write('abc def')
  with open('in.txt') as in_file:
  with open('out.txt', 'w') as out_file:
  text = in_file.read()
  assert text == 'abc def'
  text = text.title()
  assert text == 'Abc Def'
  out_file.write(text)
  assert open('out.txt').read() == ''
  assert open('out.txt').read() == 'Abc Def'

Python 3.1的另一项改进就是,gzip.GzipFile和bz2.BZ2File现在也能用于WITH语句。我们知道,这些都是压缩后的文件格式。下面的示例代码将使用gzip文件和bz2文件来存储5000个字节的内容,并显示其尺寸。这里还有用到一些额外的Python 3特性,比如带有命名属性的统计结果和高级字符串格式化。

  from bz2 import BZ2File
  from gzip import GzipFile
  import os
  with GzipFile('1.gz', 'wb') as g, BZ2File('1.bz2', 'wb') as b:
  g.write(b'X' * 5000)
  b.write(b'X' * 5000)
  for ext in ('.gz', '.bz2'):
  filename = '1' + ext
  print ('The size of the {0} file is {1.st_size} bytes'.format(ext, os.stat(filename)))输出的结果:
  The size of the .gz file is 43 bytes
  The size of the .bz2 file is 45 bytes

六、小结

Python 3.0发布七个月之后,Python核心开发人员于2009年6月27日发布了新的Python 3.1版本。虽然此3.1版本只是对Python 3.0的一次小型升级,但是它不仅为开发者带来许多让人感兴趣的特性,同时在性能方面也有所改善。本文为读者详细介绍了Python 3.1版本在核心语言方面的变化,在接下来的文章中,我们将继续为读者介绍新版本中标准程序库和性能改善方面的变化。

(0)

相关推荐

  • Python中使用PIPE操作Linux管道

    Linux中进程的通信方式有信号,管道,共享内存,消息队列socket等.其中管道是*nix系统进程间通信的最古老形式,所有*nix都提供这种通信方式.管道是一种半双工的通信机制,也就是说,它只能一端用来读,另外一端用来写:另外,管道只能用来在具有公共祖先的两个进程之间通信.管道通信遵循先进先出的原理,并且数据只能被读取一次,当此段数据被读取后,马上会从数据中消失,这一点很重要. Linux上,创建管道使用pipe函数,当它执行后,会产生两个文件描述符,分别为读端和写端.单个进程中的管道几乎没有

  • 使用Python编写Linux系统守护进程实例

    守护进程(daemon)是指在UNIX或其他多任务操作系统中在后台执行的电脑程序,并不会接受电脑用户的直接操控.此类程序会被以进程的形式初始化.通常,守护进程没有任何存在的父进程(即PPID=1),且在UNIX系统进程层级中直接位于init之下.守护进程程序通常通过如下方法使自己成为守护进程:对一个子进程调用fork,然后使其父进程立即终止,使得这个子进程能在init下运行.–维基百科 守护进程区别于普通用户登陆系统后运行的进程,它是直接由系统初始化,和系统用户没有关系,而用户开启的进程依存与用

  • 详解Python3.1版本带来的核心变化

    这里我们将对Python 3.1核心语言的变化进行分析,包括字符串的格式化.说明符以及其他方面的内容.希望这些变化能对大家了解Python 3.1有所帮助. Python 3.0发布七个月之后,Python核心开发人员于2009年6月27日发布了新的Python 3.1版本.虽然此3.1版本只是对Python 3.0的一次小型升级,但是它不仅为开发者带来许多让人感兴趣的特性,同时在性能方面也有所改善.本文将为读者详细介绍Python 3.1版本在核心语言.标准程序库和性能改善方面的变化. 一.字

  • 详解Python3 pandas.merge用法

    摘要 数据分析与建模的时候大部分时间在数据准备上,包括对数据的加载.清理.转换以及重塑.pandas提供了一组高级的.灵活的.高效的核心函数,能够轻松的将数据规整化.这节主要对pandas合并数据集的merge函数进行详解.(用过SQL或其他关系型数据库的可能会对这个方法比较熟悉.)码字不易,喜欢请点赞!!! 1.merge函数的参数一览表 2.创建两个DataFrame 3.pd.merge()方法设置连接字段. 默认参数how是inner内连接,并且会按照相同的字段key进行合并,即等价于o

  • 示例详解Python3 or Python2 两者之间的差异

    每门编程语言在发布更新之后,主要版本之间都会发生很大的变化. 在本文中,Vinodh Kumar 通过示例解释了 Python 2 和 Python 3 之间的一些重大差异,以帮助说明语言的变化. 本教程主要介绍内容: 表达式 Print 选项 Unequal 操作 Range 自动迁移 性能问题 主要的内部事务更改 1.表达式 在 Python 2 中为获得计算表达式,你会键入: 但在 Python 3 中,你会键入: 因此,无论我们输入什么,值都会分配给 2 和 3 中的变量 x.当在 Py

  • 详解Python3.8+PyQt5+pyqt5-tools+Pycharm配置详细教程

    个人使用环境 WIN10x64系统,Python3.8,PyCharm2020.01.03 安装过程 一.安装Python3.8 (自己参考其他教程) 二.安装PyQt5 然后在cmd下输入指令 pip install PyQt5 也可以输入这个指令 pip install PyQt5 -i https://pypi.douban.com/simple (后面是豆瓣的镜像地址,是为了加快下载速度) 提示你更新pip,就按照提示更新(这步骤是可选的,看个人需求) 在cmd下输入 python -m

  • 详解python3类型注释annotations实用案例

    1.类型注解简介 Python是一种动态类型化的语言,不会强制使用类型提示,但为了更明确形参类型,自python3.5开始,PEP484为python引入了类型注解(type hints) 示例如下: 2.常见的数据类型 int,long,float: 整型,长整形,浮点型 bool,str: 布尔型,字符串类型 List, Tuple, Dict, Set: 列表,元组,字典, 集合 Iterable,Iterator: 可迭代类型,迭代器类型 Generator:生成器类型 Sequence

  • 详解Python3 中hasattr()、getattr()、setattr()、delattr()函数及示例代码数

    hasattr()函数 hasattr()函数用于判断是否包含对应的属性 语法: hasattr(object,name) 参数: object--对象 name--字符串,属性名 返回值: 如果对象有该属性返回True,否则返回False 示例: class People: country='China' def __init__(self,name): self.name=name def people_info(self): print('%s is xxx' %(self.name))

  • 对sklearn的使用之数据集的拆分与训练详解(python3.6)

    研修课上讲了两个例子,融合一下. 主要演示大致的过程: 导入->拆分->训练->模型报告 以及几个重要问题: ①标签二值化 ②网格搜索法调参 ③k折交叉验证 ④增加噪声特征(之前涉及) from sklearn import datasets #从cross_validation导入会出现warning,说已弃用 from sklearn.model_selection import train-test_split from sklearn.grid_search import Gri

  • 详解Python3中的 input() 函数

    一.知识介绍: 1.input() 函数,接收任意输入,将所有输入默认为字符串处理,并返回字符串类型: 2.可以用作文本输入,如用户名,密码框的值输入: 3.语法:input("提示信息:") . 二.运用演示: 1.接收任意输入,并返回字符串类型: >>>height = input("输入身高:")          #运行 输入身高: 170                      #输入整数170 >>> type(a)

  • 详解tensorflow2.x版本无法调用gpu的一种解决方法

    最近学校给了一个服务器账号用来训练神经网络使用,服务器本身配置是十路titan V,然后在上面装了tensorflow2.2,对应的python版本是3.6.2,装好之后用tf.test.is_gpu_available()查看是否能调用gpu,结果返回结果是false,具体如下: 这里tensorflow应该是检测出了gpu,但是因为某些库无法打开而导致tensorflow无法调用,返回了false,详细查看错误信息可以看到一行: 可以看到上面几个文件都顺利打开了,但是最后一个libcudnn

  • 详解Tensorflow不同版本要求与CUDA及CUDNN版本对应关系

    参考官网地址: Windows端:https://tensorflow.google.cn/install/source_windows CPU Version Python version Compiler Build tools tensorflow-1.11.0 3.5-3.6 MSVC 2015 update 3 Cmake v3.6.3 tensorflow-1.10.0 3.5-3.6 MSVC 2015 update 3 Cmake v3.6.3 tensorflow-1.9.0

随机推荐