C语言中魔性的float浮点数精度问题

2025-03-31 12:16:28

从一个问题引入

如果你以前接触过C语言，那么对下面的这段代码一定很熟悉:

#include <stdio.h>

int main(void)
{
    float f_num1 = 21.75;
    float f_num2 = 13.45;
    printf("f_num1 = %f\n", f_num1);
    printf("f_num2 = %f\n", f_num2);
    printf("f_num1 + f_num2 = %f\n", f_num1 + f_num2);

    return 0;
}

相信很多人不用运行，能够直接报出答案, f_num1 = 21.75 , f_num2 = 13.45 , f_num1 + f_num2 = 35.2 ，无论是从常识还是理论角度都不难理解。

下面我们运行一下程序，验证我们的猜测正不正确：

f_num1 = 21.750000
f_num2 = 13.450000
f_num1 + f_num2 = 35.200001

f_num1 和 f_num2 的结果和我们预想的一样，之所以后面多了四个0，是因为 %f 默认保留6位有效数字。但是 f_num1 + f_num2 的结果是什么鬼，这个 35.200001 是从哪里来的？

是不是一下子颠覆了我们的认知？

惊不惊喜，意不意外，刺不刺激？是不是发现自从学了C语言，连简单的算术都不会算了？

别急，还有更令你崩溃的。

如果是C++呢

下面我们看看以上程序的C++版本：

#include<iostream>
using namespace std;

int main(void)
{
    float f_num1 = 21.75;
    float f_num2 = 13.45;
    cout << "f_num1 = " << f_num1 << endl;
    cout << "f_num2 = " << f_num2 << endl;
    cout << "f_num1 + f_num2 = " << f_num1 + f_num2 << endl;
    return 0;
}

直接来看输出结果吧：

f_num1 = 21.75
f_num2 = 13.45
f_num1 + f_num2 = 35.2

很神奇是不是？因为这个结果看起来正常多了。

看到这里，相信我们的心里都有老大一个疑问：为什么C程序和C++程序对同样的数字处理，输出的结果却不一样的？ cout 到底做了些什么？

cout的神奇之处

为了验证cout对浮点数的处理，我们不妨看一下下面的程序：

#include <iostream>
using namespace std;

int main(void)
{
    float num1 = 5;
    float num2 = 5.00;
    float num3 = 5.14;
    float num4 = 5.140000;
    float num5 = 5.123456;
    float num6 = 5.987654321;
    cout << "num1 = " << num1 << endl;
    cout << "num2 = " << num2 << endl;
    cout << "num3 = " << num3 << endl;
    cout << "num4 = " << num4 << endl;
    cout << "num5 = " << num5 << endl;
    cout << "num6 = " << num6 << endl;

    return 0;
}

看结果来分析比较直观，运行以上程序，结果如下：

num1 = 5
num2 = 5
num3 = 5.14
num4 = 5.14
num5 = 5.12346
num6 = 5.98765

从 num1 和 num2 ， num3 和 num4 这两组结果可以知道， cout 对于 float 类型数值小数点后面的0是直接省去了的（这点和C语言格式化输出的%g有点像）。

从 num5 和 num6 两组结果不难分析出， cout 对于浮点型数值，最多保留6位有效数字。

以上是cout处理浮点数时的特点，应该记住。

事实上，我们使用 iostream 库里的 cout.setf 不难使 cout 恢复精度。我们对上面的代码修改如下：

#include<iostream>
using namespace std;

int main(void)
{
    float f_num1 = 21.75;
    float f_num2 = 13.45;
    cout.setf(ios_base::fixed, ios_base::floatfield);
    cout << "f_num1 = " << f_num1 << endl;
    cout << "f_num2 = " << f_num2 << endl;
    cout << "f_num1 + f_num2 = " << f_num1 + f_num2 << endl;
    return 0;
}

输出的结果就与C语言版本一模一样了：

f_num1 = 21.750000
f_num2 = 13.450000
f_num1 + f_num2 = 35.200001

答案呼之欲出

文章写到这里，相信你已经看出来问题的所在了。

不错，之所以结果不一样，正是由于精度引起的！

让我们回顾一下官方教材里关于 float 精度的描述：

浮点型和表示单精度、双精度和扩展精度值。 C++ 标准指定了一个浮点数有效位数的最小值，然而大多数编译器都实现了更高的精度。通常， float 以一个字（32比特）来表示， double 以2个字（64比特）来表示， long double 以3或4个字（96或128比特）来表示。一般来说，类型 float 和 double 分别有7和16个有效位；类型 long double 则常常被用于有特殊浮点需求的硬件，它的具体实现不同，精度也各不相同。（《C++ Primer第五版》）

由以上描述，我们不难知道，对于 float 来说，最多只有7个有效位，这也就意味着，当实际存储的精度大于 float 的精度范围时，就会出现精度丢失现象。

为了进一步佐证上述问题，我们不妨将 float 的数值放大10亿倍，看看里面存储的值到底是多少：

#include<iostream>
using namespace std;

int main(void)
{
    float f_num1 = 21.75;
    float f_num2 = 13.45;
    cout.setf(ios_base::fixed, ios_base::floatfield);
    int billion = 1E9;
    float f_num10 = f_num1 * billion;
    float f_num20 = f_num2 * billion;
    cout << "f_num1 = " << f_num1 << endl;
    cout << "f_num2 = " << f_num2 << endl;

    cout << "f_num10 = " << f_num10 << endl;
    cout << "f_num20 = " << f_num20 << endl;
    return 0;
}

以上程序运行结果如下：

f_num1 = 21.750000
f_num2 = 13.450000
f_num10 = 21749999616.000000
f_num20 = 13449999360.000000

由此我们不难推断，21.75在实际存储时，并不是存储的21.75，而是21.749999616，同样的，12.45存储的是12.449999360，这样计算出来之后自然就会造成结果的不正确。

再看一个例子

我们再来看一个精度丢失造成运算结果不正确的例子。

#include<iostream>
using namespace std;

int main(void)
{
    float num1 = 2.3410E23;
    float num2 = num1 + 1.0f;
    cout << "num2 - num1 = " << num2 - num1 << endl;
    return 0;
}

如果精度不丢失，运算结果应该为1才对，可是因为精度丢失，导致最后的加1实际和没加效果一样，计算出来的结果是0。

num2 - num1 = 0

怎么解决

那么，既然float有这么多稀奇古怪的问题，应该怎么去解决和避免呢？

首先，当然推荐大家在编程时尽量使用高精度的浮点类型

比如double就比float精度要高，很多时候，使用double能够避免很多问题，比如本文一开始提到的问题，如果使用double就能完美解决：

#include <stdio.h>

int main(void)
{
    double f_num1 = 21.75;
    double f_num2 = 13.45;
    printf("f_num1 = %lf\n", f_num1);
    printf("f_num2 = %lf\n", f_num2);
    printf("f_num1 + f_num2 = %lf\n", f_num1 + f_num2);

    return 0;
}

大家可以自己运行一下看看结果。

double 类型可以解决大部分精度丢失问题，基本上满足日常使用了，但是仍然不能避免精度丢失（ double 也有精度限制），这时候就需要想另外的方法来解决了。

万能的cout

前面提到过， cout 其实是可以解决这种精度丢失问题的，所以如果不是对效率要求过高或者要求格式化输出（其实 cout 也可以实现格式化输出，此处不详细展开）必须使用 printf ，在编写C++程序时，建议使用 cout 代替 printf 。

写在最后

本文只是简单的介绍了一下浮点型数值的精度问题，如果要深入细究，肯定不止这么多内容，比如浮点型数值在内存中是如何存储的？在字节里是如何分布的？这才是真正核心的原理部分。在这里只浅尝辄止地讲述了一下，但相信阅读者已经对精度问题有了一个初步的认识。

到此这篇关于C语言中魔性的float浮点数精度问题的文章就介绍到这了,更多相关C语言float浮点数精度内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

PHP中两个float(浮点数)比较实例分析

本文实例讲述了PHP中两个float(浮点数)比较方法.分享给大家供大家参考.具体如下: 最近在开发一个合同管理系统的时候,涉及到两个浮点数比较,算是把我郁闷惨了. 在N久以前,就不晓得从哪里听来的一个"不要用等号去比较浮点数"的"真理",自己平时也在用,好像没有出现啥问题,可这次问题总算是来了. <?php $sum = "12300.00"; $a = "10000.30"; $b = "2000.30&q
基于C++浮点数(float、double)类型数据比较与转换的详解

浮点数在内存中的存储机制和整型数不同,其有舍入误差,在计算机中用近似表示任意某个实数.具体的说,这个实数由一个整数或定点数(即尾数)乘以某个基数(计算机中通常是2)的整数次幂得到,这种表示方法类似于基数为10的科学记数法.所以浮点数在运算过程中通常伴随着因为无法精确表示而进行的近似或舍入.但是这种设计的好处是可以在固定的长度上存储更大范围的数.1.将字符串转换为float.double过程存在精度损失,只是float.double各自损失的精度不相同而已std::string str="8.2&
C语言中魔性的float浮点数精度问题

从一个问题引入如果你以前接触过C语言,那么对下面的这段代码一定很熟悉: #include <stdio.h> int main(void) { float f_num1 = 21.75; float f_num2 = 13.45; printf("f_num1 = %f\n", f_num1); printf("f_num2 = %f\n", f_num2); printf("f_num1 + f_num2 = %f\n", f_n
javascript中的float运算精度实例分析

有人问到一个js问题: 复制代码代码如下: var i = 0.07; var r = i*100; alert(r); 结果为什么是7.0000000000000001? 查了下资料,其实我们知道JavsScript中,变量在存储时并不区分number和float类型,而是统一按float存储.而javascript使用IEEE 754-2008 标准定义的64bit浮点格式存储number,按照IEEE 754的定义: http://en.wikipedia.org/wiki/IEEE_7
C语言中浮点数的精度丢失问题解决

目录一先来看一段代码运行结果: 二如何解决 (1)浮点数的大小比较 (2)含浮点数的表达式和0.0的比较总结一先来看一段代码 #include<stdio.h> int main() { double test=0.1; printf("%.100lf",test); return 0; } 运行结果: 直接从现象说结果:精度丢失由于计算机二进制转化过程中因为比特位过多发生数据的截断导致的,这个结果是可以偏大也可以偏小的. 解释一下:首先要知道二进制转换为十进
JS中浮点数精度问题的分析与解决方法

目录前言问题的发现浮点数运算后的精度问题 toFixed奇葩问题为什么会产生浮点数的存储浮点数的运算解决方法解决toFixed 解决浮点数运算精度附:JS浮点数精度问题的一些实用建议总结前言最近在做项目的时候,涉及到商品价格的计算,经常会出现计算出现精度问题.刚开始草草了事,直接用toFixed就解决了问题,并没有好好的思考一下这个问题.后来慢慢的,问题越来越多,连toFixed也出现了(允悲),后来经过搜索网上的各种博客和论坛,整理总结了一下. 问题的发现总结了一下,
Java中浮点数精度问题的解决方法

问题描述在项目中用Java做浮点数计算时,发现对于4.015*100这样的计算,结果不是预料中的401.5,而是401.49999999999994.如此长的位数,对于显示来说很不友好. 问题原因:浮点数表示查阅相关资料,发现原因是:计算机中的浮点数并不能完全精确表示.例如,对于一个double型的38414.4来说,计算机是这样存储它的: 转成二进制:1001011000001110.0110011001100110011001100110011001100 转成科学计数法:1.0010
C++中double浮点数精度丢失的深入分析

看了一篇关于C/C++浮点数的博文,在Win32下,把int, 指针地址,long等4字节整数赋给一个double后,再用该double数赋给原始类型的数,得到的结果于最初的数值一致,即不存在任何精度丢失.例如下面的结果将总是true: long a=123456; //assign any long number here double db=a; long b=db; printf("%s\n",a==b?"true":"false"); 但
C语言详解float类型在内存中的存储方式

目录 1.例子 2.浮点数存储规则 1.例子 int main() { int n = 9; float *pFloat = (float *)&n; printf("n的值为:%d\n",n); printf("*pFloat的值为:%f\n",*pFloat); *pFloat = 9.0; printf("num的值为:%d\n",n); printf("*pFloat的值为:%f\n",*pFloat); re
关于Python中浮点数精度处理的技巧总结

前言最近在使用Python的时候遇到浮点数运算,发现经常会碰到如下情况: 出现上面的情况,主要还是因浮点数在计算机中实际是以二进制保存的,有些数不精确. 比如说: 0.1是十进制,转化为二进制后它是个无限循环的数: 0.00011001100110011001100110011001100110011001100110011001100 而python是以双精度(64)位来保存浮点数,多余的位会被截掉,所以看到的是0.1,但在电脑上实际保存的已不是精确的0.1,参与运算后,也就有可能点误差,特
C语言double和float 实例分析

小数也称实数或浮点数.例如,0.0.75.0.4.023.0.27.-937.198 都是合法的小数.这是常见的小数的表现形式,称为十进制形式. 除了十进制形式,也可以采用指数形式,例如 7.25×102.0.0368×105.100.22×10-2 等.任何小数都可以用指数形式来表示. C语言中的小数也有这两种表示形式.在书写时,十进制形式和数学中的一样,指数形式有所差异. 在C语言中小数的指数形式为: aEn 或 aen a 为尾数部分,是一个十进制数,n 为指数部分,是一个十进制整数,E或