python 浮点数四舍五入需要注意的地方

本文主要分享基于python的数据分析三方库pandas,numpy的一次爬坑经历,发现并分析了python语言对于浮点数精度处理不准确的问题,并在最后给出合理的解决方案。如果你也在用python处理数据,建议看一下,毕竟0.1的误差都可能造成比较大的影响。

问题出现

早上到了公司,领导发了几个文件过来,说这两天测试环境跑出来的数据,与实际情况有所出入,看看哪出的问题,尽快解决···

开始排查

先对比数据,发现并不是所有的数据都出现问题,只有10%左右的数据有这个问题,说明应该不是逻辑上的问题,初步判断可能为个别情况需要特殊处理,考虑不周导致
检查梳理各个运算模块,用debug断点调试一波,确定了数据出现偏差的模块
通过单独测试这个单元模块最终确定,涉及到两数相除结果为0.5(浮点数)的地方有问题
预期结果:np.round(0.5)=1,实际运算结果:np.round(0.5)=0,于是我做了如下的试验

# 基于python3.7版本
>>> import numpy as np 

# 先看看 0 < x < 1 这个范围的结果,发现有问题
>>> np.round(0.50)
0.0
>>> np.round(0.51)
1.0
>>> np.round(0.49)
0.0 

# 我担心是不是只有小数点为.5的都会呈现这种问题,所以测试了 x > 1的结果,发现还是有问题
>>> np.round(1.5)
2.0
>>> np.round(2.5)
2.0
>>> np.round(3.5)
4.0
>>> np.round(4.5)
4.0 

通过对比,发现确实涉及到.5的值会有些和预想的不同,看看啥原因

分析问题

确实发现了关于浮点数(.5出现了理解上的偏差),看看官方文档怎么解释这个现象

numpy.around(a, decimals=0, out=None)[source]
Evenly round to the given number of decimals.

# 对于恰好介于四舍五入的十进制值之间的中间值(.5),NumPy会四舍五入为最接近的偶数值。
# 因此1.5和2.5四舍五入为2.0,-0.5和0.5四舍五入为0.0,依此类推。
For values exactly halfway between rounded decimal values,
NumPy rounds to the nearest even value.
Thus 1.5 and 2.5 round to 2.0, -0.5 and 0.5 round to 0.0, etc.

# np.around使用快速但有时不精确的算法来舍入浮点数据类型。
# 对于正小数,它等效于np.true_divide(np.rint(a * 10 **小数),10 **小数),
# 由于IEEE浮点标准[1]和 十次方缩放时引入的错误
np.around uses a fast but sometimes inexact algorithm to round floating-point datatypes.
For positive decimals it is equivalent to np.true_divide(np.rint(a * 10**decimals), 10**decimals),
which has error due to the inexact representation of decimal fractions in the IEEE floating point standard [1]
and errors introduced when scaling by powers of ten

  • 其实也就是说:对于带有.5这种刚好介于中间的值,返回的是相邻的偶数值
  • 白话解释:如果一个数字带有浮点数(.5),整数部分为偶数,则返回这个偶数;整数部分奇数,则返回这个奇数+1的偶数
  • 规律解释:如果整数部分能够整除2,则返回整数部分;如果整数部分不能整除2,则返回整数部分 +1

解决问题

先不做任何改动,看下数据误差的情形

# 我们为了先看下现象,构造如下案例
import pandas as pd
import numpy as np 

df = pd.DataFrame({"num1": [1, 1, 1.5, 5, 7.5], "num2": [2, 3, 1, 6, 3]}) 

df["真实值"] = df["num1"] / df["num2"]
# 看下round函数过后的结果
df["偏差值"] = np.round(df["num1"] / df["num2"]) 

原始结果图片如下

不做处理,期望值和偏差值不等的情况出现

我的解决方案

  • 我根据我的精度要求,构建精度范围所需要保留的小数点的最后一位,通过这个数字是否为5,判断是否需要向上取整
  • 举例来说,本案例中我只需要保留整数部分的数据,那么我只需要确定小数点后第一位是否是数字5就可以了

上代码

import pandas as pd
import numpy as np
import math 

df = pd.DataFrame({"除数": [1, 1, 1.5, 5, 7.5], "被除数": [2, 3, 1, 6, 3]}) 

# 记录真实值
df["真实值"] = df["除数"] / df["被除数"] 

# 记录整数部分
df["辅助整数列"] = df["真实值"].apply(lambda x: math.modf(x)[1]) 

# 记录小数部分,因为我的最后结果精度为只保留整数部分,所以我只需要保留一个小数点位进行判断是否需要进位操作
df["辅助小数列"] = df["真实值"].apply(lambda x: str(math.modf(x)[0]).split(".")[1][0]) 

# 小数点后的第一位是为5,则向上取整,不是5则调用原np.round就行了
df["期望值修正"] = df.apply(lambda x: x.辅助整数列 + 1 if (x.辅助小数列 == "5") else np.round(x.真实值), axis=1)

结果如下所示

以上就是python 四舍五入需要注意的地方的详细内容,更多关于python 四舍五入的资料请关注我们其它相关文章!

(0)

相关推荐

  • python3 小数位的四舍五入(用两种方法解决round 遇5不进)

    round( )函数简介 菜鸟教程中介绍到,round() 函数作用就是,返回浮点数x的四舍五入值. > round( x [, n] ) 参数x,n均为数值表达式,返回值为x的四舍五入值.n为保留的小数位数,不加n则只保留x四舍五入后的整数部分. >>> round(2.3) 2 >>> round(2.45, 1) 2.5 特殊情况 上面的结果并没有错误,这里再用2.675测试一下: >>> round(2.675, 2) 2.67 显然结果

  • Python浮点数四舍五入问题的分析与解决方法

    问题 昨天遇到一个问题,在 6.6045 保留三位小数时,使用 round() 函数进行计算,我们希望得到 6.605,然而: >>> round(6.6045, 3) 6.604 网上有人说,因为在计算机里面,小数是不精确的,例如 1.115 在计算机中实际上是 1.114999999999999991182,所以当你对这个小数精确到小数点后两位的时候,实际上小数点后第三位是 4,所以四舍五入,结果为 1.11. 这种说法,对了一半. 因为并不是所有的小数在计算机中都是不精确的.例如

  • python 浮点数四舍五入需要注意的地方

    本文主要分享基于python的数据分析三方库pandas,numpy的一次爬坑经历,发现并分析了python语言对于浮点数精度处理不准确的问题,并在最后给出合理的解决方案.如果你也在用python处理数据,建议看一下,毕竟0.1的误差都可能造成比较大的影响. 问题出现 早上到了公司,领导发了几个文件过来,说这两天测试环境跑出来的数据,与实际情况有所出入,看看哪出的问题,尽快解决··· 开始排查 先对比数据,发现并不是所有的数据都出现问题,只有10%左右的数据有这个问题,说明应该不是逻辑上的问题,

  • Python浮点数取整、格式化和NaN处理的操作方法

    目录 1. 取整的三种方法 1.1 强转int类型 1.2 采用math.ceil和math.floor 1.3 采用round 2. 格式化浮点数输出 3. 执行精确的小数计算 4. 无穷大.负无穷大和NaN的判断测试 参考 强转int类型会直接对浮点数的小数部分进行截断(无论是正还是负).还有一种方法是math.ceil和math.floor.无论是正数还是负数,都遵循:ceil往数轴正方向取整,floor往数轴负方向取整.round原型为round(value, ndigits),可以将一

  • 控制Python浮点数输出位数的操作方法

    目录 技术背景 常规控制方法 取有效数字 总结概要 在python的输出结果中,尤其是浮点数的输出,当我们需要写入文本文件时,最好是采用统一的输出格式,这样也能够增强结果的可读性.而对于浮点数输出位数的控制,可以通过{:.4f}.%.4f来指定打印或者输出时的字符串占据空间,也可以通过round函数来对输出前的结果进行转化.而如果是取有效数字,需要用到{:.4},这几种方法没有优劣,只有看不同的场景,选取不同的精度控制方案. 技术背景 在Python的一些长效任务中,不可避免的需要向文本文件.二

  • python中四舍五入的正确打开方式

    round()函数 (注意:下面的我也不清楚是否正确,我只是发表一下我的观点) 对于简单的舍入运算,使用内置的 round(value, ndigits) 函数即可 强烈建议不要去深究,就直接得结果就好 ndigiths可以为正数,也可以为负数,还可以为0,可以为空 n:就是精确到第n位小数,对整数没有影响,1为精确到十分位(注意:小数就是从十分位往后推的) -n:就是精确到整数位,-1为精确到十位,然后就是百位千位-有小数位就全舍掉,不管多大,但会保留一个为0的小数位 0:精确到个位,但会保留

  • Python强大的语法支持你知道吗

    目录 1 Python便捷的数学运算 1.1 整数计算 1.2 浮点数计算 1.3 复数计算 1.4 内置数学函数 2 简单的字符串处理 2.1 字符串标识 2.2 字符串长度 2.3 字符串的简单拼接 3 类型转换 总结 1 Python便捷的数学运算 1.1 整数计算 首先,我们熟知的整数是不带小数部分的整数,Python支持4种基本算术运算:+(加).-(减).*(乘)和 /(除).并且使用 ** 和 % 表示乘方和求余.并且其优先级与数学所学的优先级是一致的.  python中还提供了一

  • Python+numpy实现一个蜘蛛纸牌游戏

    目录 1.过程 2.思路 3.配置 4.代码 四.效果图 1.过程 蜘蛛纸牌大家玩过没有?之前的电脑上自带的游戏,用他来摸鱼过的举个手. 但是现在的电脑上已经没有蜘蛛纸牌了.所以…… 可不可以自己做一个呢? 想法有了,实践开始. 首先,应该怎么写?首选的方案就是pygame和numpy. 最后选了numpy.一是因为作者用电脑的时间比较短,没有时间力,而手机的在线编译器可以用numpy,不能用pygame.二是因为之前了解过numpy,但是pygame当时都没安装,是昨天才安装完毕的三是因为想挑

  • Python语言的12个基础知识点小结

    python编程中常用的12种基础知识总结:正则表达式替换,遍历目录方法,列表按列排序.去重,字典排序,字典.列表.字符串互转,时间对象操作,命令行参数解析(getopt),print 格式化输出,进制转换,Python调用系统命令或者脚本,Python 读写文件. 1.正则表达式替换 目标: 将字符串line中的 overview.gif 替换成其他字符串 复制代码 代码如下: >>> line = '<IMG ALIGN="middle" SRC=\'#\'

  • 浅谈Python里面None True False之间的区别

    None虽然跟True False一样都是布尔值. 虽然None不表示任何数据,但却具有很重要的作用. 它和False之间的区别还是很大的! 例子: >>> t = None >>> if t: ... print("something") ... else: ... print("nothing") ... nothing 区分None和False.使用is来操作! >>> if t is None: ...

  • Python常见数据结构详解

    本文详细罗列归纳了Python常见数据结构,并附以实例加以说明,相信对读者有一定的参考借鉴价值. 总体而言Python中常见的数据结构可以统称为容器(container).而序列(如列表和元组).映射(如字典)以及集合(set)是三类主要的容器. 一.序列(列表.元组和字符串) 序列中的每个元素都有自己的编号.Python中有6种内建的序列.其中列表和元组是最常见的类型.其他包括字符串.Unicode字符串.buffer对象和xrange对象.下面重点介绍下列表.元组和字符串. 1.列表 列表是

随机推荐