Python中关于浮点数的冷知识

2025-04-03 21:36:29

本周的PyCoder's Weekly 上分享了一篇小文章，它里面提到的冷知识很有意思，我稍作补充，分享给大家。

它提到的部分问题，读者们可以先思考下：

若两个元组相等，即 a==b 且 a is b，那么相同索引的元素（如 a[0] 、b[0]）是否必然相等呢？
若两个对象的 hash 结果相等，即 hash(a) == hash(b)，那么它们是否必然相等呢？

答案当然都为否（不然就不叫冷知识了），大家可以先尝试回答一下，然后再往下看。

-----思考分割线-----

好了，先来看看第一个问题。两个相同的元组 a、b，它们有如下的关系：

>>> a = (float('nan'),)
>>> b = a
>>> a  # (nan,)
>>> b  # (nan,)

>>> type(a), type(b)
(<type 'tuple'>, <type 'tuple'>)

>>> a == b
True

>>> a is b # 即 id(a) == id(b)
True

>>> a[0] == b[0]
False

以上代码表明：a 等于 b（类型、值与 id 都相等），但是它们的对位元素却不相等。

两个元组都只有一个元素（逗号后面没有别的元素，这是单元素的元组的表示方法，即 len(a)==1 ）。float() 是个内置函数，可以将入参构造成一个浮点数。

为什么会这样呢？先查阅一下文档，这个内置函数的解析规则是：

sign      ::= "+" | "-"
infinity    ::= "Infinity" | "inf"
nan      ::= "nan"
numeric_value ::= floatnumber | infinity | nan
numeric_string ::= [sign] numeric_value

它在解析时，可以解析前后的空格、前缀的加减号（+/-）、浮点数，除此之外，还可以解析两类字符串（不区分大小写）："Infinity"或"inf"，表示无穷大数；“nan”，表示不是数（not-a-number），确切地说，指的是除了数以外的所有东西。

前面分享的第一个冷知识就跟“nan”有关，作为整体，两个元组相等，但是它们唯一的元素却不相等。之所以会这样，因为“nan”表示除了数以外的东西，它是一个范围，所以不可比较。

作为对比，我们来看看两个“无穷大的浮点数”是什么结果：

>>> a = (float('inf'),)
>>> b = a
>>> a  # (inf,)
>>> b  # (inf,)

>>> a == b # True
>>> a is b # True
>>> a[0] == b[0] # True

注意最后一次比较，它跟前面的两个元组恰好相反，由此，我们可以得出结论：两个无穷大的浮点数，数值相等，而两个“不是数的东西”，数值不相等。

化简一下，可以这样看：

>>> a = float('inf')
>>> b = float('inf')
>>> c = float('nan')
>>> d = float('nan')

>>> a == b # True
>>> c == d # False

以上就是第一个冷知识的揭秘。接着看第二个：

>>> hash(float('nan')) == hash(float('nan'))
True

前面刚说了两个“不是数的东西”不相等，这里却显示它们的哈希结果相等，这挺违背常理的。

我们可以推理出一条简单的结论：不相等的两个对象，其哈希结果可能相等。

原因在于，hash(float('nan')) 的结果等于 0，它是个固定值，作比较时当然就相等了。

其实，关于 hash() 函数，还埋了一个彩蛋：

>>> hash(float('inf')) # 314159
>>> hash(float('-inf')) # -314159

有没有觉得这个数值很熟悉啊？它正是圆周率的前五位 3.14159，去除小数点后的结果。在早期的 Python 版本中，负无穷大数的哈希结果其实是 -271828，正是取自于自然对数 e。这两个数都是硬编码在 Python 解释器中的，算是某种致敬吧。

由于 float('nan') 的哈希值相等，这通常意味着它们不可以作为字典的不同键值，但是事实却出人意料：

>>> a = {float('nan'): 1, float('nan'): 2}
>>> a
{nan: 1, nan: 2}

# 作为对比：
>>> b = {float('inf'): 1, float('inf'): 2}
>>> b
{inf: 2}

如上所示，两个 nan 键值在表示上一模一样（注意，它们没有用引号括起来），它们可以共存，而 inf 却只能归并成一个，再次展示出了 nan 的神奇。

好了，两个很冷的小知识分享完毕，背后的原因都在于 float() 取浮点数时，Python 允许了 nan（不是数）的存在，它表示不确切的存在，所以导致了这些奇怪的结果。

最后，我们作下小结：

包含 float('nan') 的两个元组，当做整体作比较时，结果相等；两个相等的元组，其对位的元素可能不相等
float('nan') 表示一个“不是数”的东西，它本身不是确定值，两个对象作比较时不相等，但是其哈希结果是固定值，作比较时相等；可用作字典的键值，而且是不冲突的键值
float('inf') 表示一个无穷大的浮点数，可看作确定的值，两个对象做比较时相等，其哈希结果也相等；可用作字典的键值，但是会产生冲突
float('nan') 的哈希结果为 0，float('inf') 的哈希结果为 314159

参考资料：

https://docs.python.org/3/library/functions.html#float

https://www.pythondoeswhat.com/2019/09/welcome-to-float-zone.html

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对我们的支持。

Python判断字符串是否为字母或者数字(浮点数)的多种方法

str为字符串s为字符串 str.isalnum() 所有字符都是数字或者字母 str.isalpha() 所有字符都是字母 str.isdigit() 所有字符都是数字 str.isspace() 所有字符都是空白字符.t.n.r 检查字符串是数字/浮点数方法 float部分 >> float('Nan') nan >> float('Nan') nan >> float('nan') nan >> float('INF') inf >> fl
python读取浮点数和读取文本文件示例

从文本文件中读入浮点数据,是最常见的任务之一,python没有scanf这样的输入函数,但我们可以利用正规表达式从读入的字符串中提取出浮点数复制代码代码如下: import refp = open('c:/1.txt', 'r')s = fp.readline()print(s)aList = re.findall('([-+]?\d+(\.\d*)?|\.\d+)([eE][-+]?\d+)?',s) #使用正规表达式搜索字符串print(aList)for ss in aList:
python使用正则搜索字符串或文件中的浮点数代码实例

用python和numpy处理数据次数比较多,写了几个小函数,可以方便地读写数据: # -*- coding: utf-8 -*- #---------------------------------------------------------------------- # FileName:gettxtdata.py #功能:读取字符串和文件中的数值数据(浮点数) #主要提供类似matlab中的dlmread和dlmwrite函数 #同时提供loadtxtdata和savetxtdata函
Python双精度浮点数运算并分行显示操作示例

本文实例讲述了Python双精度浮点数运算并分行显示操作.分享给大家供大家参考,具体如下: #coding=utf8 def doubleType(): ''''' Python中的浮点数是双精度浮点数,可以用十进制或科学计数法表示. 实际精度依赖于机器架构和创建Python解释器的编译器. 浮点数值通常都有一个小数点和一个可选的后缀e(大写或小写,表示科学计数法). 在e和指数之间可以用正(+)或负(-)表示指数的正负(正数可以省略符号) ''' (one,two,three,four,fiv
Python两个整数相除得到浮点数值的方法

在python中进行两个整数相除的时候,在默认情况下都是只能够得到整数的值,而在需要进行对除所得的结果进行精确地求值时,想在运算后即得到浮点值,那么如何进行处理呢? 1.修改被除数的值为带小数点的形式即可得到浮点值,这种方法在被除数事先知道的情况下才可以采用有效,而这种情况意味着被除数的值是写死的.固定的,在绝大多数的情况下是不可行的: 2.在进行除法运算前导入一个实除法的模块,即可在两个整数进行相除的时候得到浮点的结果; 复制代码代码如下: from __future__ import di
python中精确输出JSON浮点数的方法

有时需要在JSON中使用浮点数,比如价格.坐标等信息.但python中的浮点数相当不准确, 例如下面的代码: 复制代码代码如下: #!/usr/bin/env python import json as json data = [ 0.333, 0.999, 0.1 ]print json.dumps(data) 输出结果如下: 复制代码代码如下: $ python floatjson.py[0.33300000000000002, 0.999, 0.10000000000000001] 能
python中实现精确的浮点数运算详解

为什么说浮点数缺乏精确性? 在开始本文之前,让我们先来谈谈浮点数为什么缺乏精确性的问题,其实这不是Python的问题,而是实数的无限精度跟计算机的有限内存之间的矛盾. 举个例子,假如说我只能使用整数(即只精确到个位,计算机内的浮点数也只有有限精度,以C语言中的双精度浮点数double为例,精度为52个二进制位),要表示任意实数(无限精度)的时候我就只能通过舍入(rounding)来近似表示. 比如1.2我会表示成1,2.4表示成2,3.6表示成4. 所以呢? 在算1.2 - 1.2的时候,由于计
python十进制和二进制的转换方法(含浮点数)

本文介绍了python十进制和二进制的转换方法(含浮点数),分享给大家,也给自己留个笔记,具体如下: 我终于写完了 , 十进制转二进制的小数部分卡了我将近一个小时上代码 #-*- coding: utf-8 from decimal import Decimal def bTod(n, pre=4): ''' 把一个带小数的二进制数n转换成十进制小数点后面保留pre位小数 ''' string_number1 = str(n) #number1 表示二进制数,number2表示十进制数 de
关于Python中浮点数精度处理的技巧总结

前言最近在使用Python的时候遇到浮点数运算,发现经常会碰到如下情况: 出现上面的情况,主要还是因浮点数在计算机中实际是以二进制保存的,有些数不精确. 比如说: 0.1是十进制,转化为二进制后它是个无限循环的数: 0.00011001100110011001100110011001100110011001100110011001100 而python是以双精度(64)位来保存浮点数,多余的位会被截掉,所以看到的是0.1,但在电脑上实际保存的已不是精确的0.1,参与运算后,也就有可能点误差,特
Python字符串转换成浮点数函数分享

利用map和reduce编写一个str2float函数,把字符串'123.456'转换成浮点数123.456 from functools import reduce def str2float(s): return reduce(lambda x,y:x+int2dec(y),map(str2int,s.split('.'))) def char2num(s): return {'0':0,'1':1,'2':2,'3':3,'4':4,'5':5,'6':6,'7':7,'8':8,'9':

Python中关于浮点数的冷知识

相关推荐

随机推荐