C++浮点数在内存中的存储详解
目录
- 前言:
- 浮点数的表示形式
- 浮点数存储模型
- 有效数字M
- 指数E
- 例题讲解
- 总结
前言:
我们在码代码的时候,经常遇到过以整数形式存入,浮点数形式输出;或者浮点数形式存入整数形式输出。输出的结果往往让人意想不到,那么,为什么会发生这样的变化,又是什么导致发生变化,接下来,就让我们从存储内部结构出发,带你深度解刨!
我们以一个例子来说明一切
#include<stdio.h> int main() { int n = 9; float *pFloat = (float *)&n; printf("n的值为:%d\n",n); printf("*pFloat的值为:%f\n",*pFloat); *pFloat = 9.0; printf("n的值为:%d\n",n); printf("*pFloat的值为:%f\n",*pFloat); return 0; }
这个例子我们将n以整数形式输入,再定义一个指针变量来存n的地址,,分别将n以整数、浮点数形式输出。
输出结果如下
n和*pFloat在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别那么大?
要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。
浮点数的表示形式
根据国际标准IEEE(电气和电子工程协会)754,任意一个二进制浮点数V可以表示成下面的形式
(-1)^S*M*2^E(-1)^S表示符号位,当S=0,V为正数;当S=1,V为负数。M表示有效数字,大于等于1,小于2.2^E表示指数位。
举例来说:
十进制的5.0,写成二进制是101.0,用科学计数法就是:1.01*2^2(类比于十进制的科学计数法:20000=2*10^4);
由于5.0是正数,所以S=0,根据上面,M=1.01,E=2。
所以,写成浮点数就是:(-1)^0*1.01*2^2。
浮点数存储模型
IEEE754规定:
对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。
对于64位的浮点数,最高的1位是符号位s,接着的11位是指数E,剩下的52位为有效数字M。
有效数字M
前面我们给了M的范围是1≤M<2,那么为什么范围是这么多?我们知道,二进制最高位为1,用科学计数法表示以后,M的形式为1.xxxxx的形式,其中xxxxx表示小数部分。
IEEE754规定,在计算机内部保存M是,默认这个数的第一位总是1,因此可以被舍去,只保存后面的xxxxx部分。比如保存1.01的时候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第一位的1舍去以后,等于可以保存24位有效数字。
指数E
至于指数E,情况就比较复杂。
首先,E为一个无符号整型(unsingde int)
这意味着,如果E为8位,它的取值范围为0~255;如果E是11位,它的取值范围为0~204。但是我们知道,科学计数法中的E是可以出现负数的,所以IEEE754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数是127;对于1位的E,这个中间数是1023。
比如:2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即化为二进制为10001001。
对于指数E从内存中取出还可以再分成三种情况:
(1) E不全为0或不全为1
这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第一位的1。
比如:
0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即小数点右移1位,则为1.0*2^(-1),其阶码为-1+127=126,表示为01111110而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进制表示形式为:
0 01111110 00000000000000000000000
(2)E全为0
这时,浮点数的指数E等于1-127(或者1023)即为真实值,有效数字M不再加上第一位的1,而是还原为0.xxxxx的小数。这样做是为了表示±0,以及接近于0的很小的数字。
(3)E全为1
这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位S);
例题讲解
(1)printf("n的值为:%d\n",n);
n是以整数存入的,在内存中的存储为:
输出是整数,所以 输出的还是9。
(2)printf("*pFloat的值为:%f\n",*pFloat);
*pFloat相当于n的值,但输出却是以浮点数的形式输出,但存入还是以整数形式存入,这是,内存就会把存入的0 00000000 00000000000000000001001以浮点数形式处理,这里相当于,第一位就是S,即S=0,E全为0,剩下的为M,即M=00000000000000000001001。
(3)printf("n的值为:%d\n",n);
此时,*pFloat=9.0,也就是将9.0以浮点数形式存入,以整数形式取出。
根据前面,我们写出9.0的存储:
由于是正数,所以S=0;
9转换为二进制为1001,科学计数法:1.001*2^3;
∴E=3(属于第一种,既不是全0,也不是全1),存入时要加上127,则E的真实值为:E=3+127=130,化为二进制1000 0010
M后面补0补全23位,即:001 0000 0000 0000 0000
所以浮点数在内存中的存储为:
最后输出以整数形式输出,即把0 100000010 00100000000000000000000视为要输出的数的补码,但输出的是原码,因为最高位为0,所以这个数是正数,原反补相同,则输出这个数,化为十进制就是:
(4)printf("*pFloat的值为:%f\n",*pFloat);
以浮点数形式存入,以浮点数形式输出,最后输出还是9.000000,保留6位小数。
总结
到此这篇关于C++浮点数在内存中的存储详解的文章就介绍到这了,更多相关C++ 浮点数内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!