关于Java float和double精度范围大小

目录
  • Java float和double精度范围大小
    • 一、小数的二进制转换(浮点数)
    • 二、浮点数在计算机中的存储
    • 三、指数位的偏移量与无符号表示
    • 四、小结一下
  • float和double的范围到底是多少
    • 总结一下上面的

Java float和double精度范围大小

要想理解float和double的取值范围和计算精度,必须先了解小数是如何在计算机中存储的:

举个例子:78.375,是一个正小数。要在计算机中存储这个数,需要把它表示为浮点数的格式,先执行二进制转换:

一、小数的二进制转换(浮点数)

78.375的整数部分:

小数部分:

所以,78.375的二进制形式就是1001110.011

然后,使用二进制科学记数法,有

注意,转换后用二进制科学记数法表示的这个数,有底有指数有小数部分,这个就叫做浮点数

二、浮点数在计算机中的存储

在计算机中,保存这个数使用的是浮点表示法,分为三大部分:

  • 第一部分用来存储符号位(sign),用来区分正负数这里是0,表示正数
  • 第二部分用来存储指数(exponent),这里的指数是十进制的6
  • 第三部分用来存储小数(fraction),这里的小数部分是001110011

需要注意的是,指数也有正负之分,后面再讲。

如下图所示(图片来自维基百科):

比如float类型是32位,是单精度浮点表示法:

  • 符号位(sign)占用1位,用来表示正负数,
  • 指数位(exponent)占用8位,用来表示指数,
  • 小数位(fraction)占用23位,用来表示小数,不足位数补0。

而double类型是64位,是双精度浮点表示法:

  • 符号位占用1位,指数位占用11位,小数位占用52位。

到这里其实已经可以隐隐看出:

  • 指数位决定了大小范围,因为指数位能表示的数越大则能表示的数越大嘛!
  • 而小数位决定了计算精度,因为小数位能表示的数越大,则能计算的精度越大咯!

可能还不够明白,举例子吧:

  • float的小数位只有23位,即二进制的23位,能表示的最大的十进制数为2的23次方,即8388608,即十进制的7位,严格点,精度只能百分百保证十进制的6位运算。
  • double的小数位有52位,对应十进制最大值为4 503 599 627 370 496,这个数有16位,所以计算精度只能百分百保证十进制的15位运算。

三、指数位的偏移量与无符号表示

需要注意的是指数可能是负数,也有可能是正数,即指数是有符号整数,而有符号整数的计算是比无符号整数麻烦的。所以为了减少不必要的麻烦,在实际存储指数的时候,需要把指数转换成无符号整数。那么怎么转换呢?

注意到float的指数部分是8位,则指数的取值范围是 -126到+127,为了消除负数带来的实际计算上的影响(比如比较大小,加减法等),可以在实际存储的时候,给指数做一个简单的映射,加上一个偏移量,比如float的指数偏移量为127,这样就不会有负数出现了

比如

  • 指数如果是6,则实际存储的是6+127=133,即把133转换为二进制之后再存储。
  • 指数如果是-3,则实际存储的是-3+127=124,即把124转换为二进制之后再存储。

当我们需要计算实际代表的十进制数的时候,再把指数减去偏移量即可。

对应的double类型,存储的时候指数偏移量是1023。

四、小结一下

所以用float类型来保存十进制小数78.375的话,需要先转换成浮点数,得到符号位指数小数部分

这个例子前面已经分析过,所以:

符号位是0,

指数位是6+127=133,二进制表示为10 000 101,

小数部分是001110011,不足部分请自动补0。

连起来用float表示,加粗部分是指数位,最左边是符号位0,代表正数:

0 10000101 001110011 00000 00000 0000

如果用double来保存。。。自己计算吧,太多0了。

float和double的范围到底是多少

Java中float占4个字节,32bit。计算范围公式为 ((-1)^S)* (2^(E-127))*(1.M) ,其中S占一位是符号位,E所占8bit是指数位,M占23位是尾数位。

这里一开始(1.M)部分一开始我一直没想明白为什么前面是1,突然有一天脑子开窍了,科学计数法表示的时候小数点前面就必须是1,所以规格化的时候小数点前面是1。

E占8位,所以大小是0-255,但是为了表示小数,指数部分需要可以是小数,对半一分,所以最后是E-127,也就是说指数部分为-127-128。

尾数部分没什么好说的,范围就是1-1.11……(23位全是1)

注意 :尾数这里1.1111实际上是 十进制的1 + 二进制的0.1111, 什么意思呢, 举例说明会清楚一点:

1.1 ----> 1+1/2 = 1.5 = 2-1/2

1.11 -----> 1+1/2 +1/4 = 1.75 = 2-1/4

总结一下上面的

按道理最大值应该是(2^128)*(2-2^(-23))=2^129-2^105=6.81*10^38,但是一般书上说的都是3.40*10^38,那么问题又来了,为什么会大了2倍?

排除掉所有出书的人抄来抄去的行为导致所有的书都错了这个因素,那么剩下的只能是上面某个地方出了问题。首先,回到上面那个我加粗的规格化上去(我个人觉得完全可以用一般情况来代替这个词),仔细想想,假如所有的数都是上面那种规格化表示的时候:

第一:得到的数永远是(1.M)乘以一个数,指数部分是不会为0的,那么0怎么表示?

第二:无穷大和无穷小,还有NAN(not a number)又是怎么用这32bit表示出来的?我曾经想过的一个解释是,计算机里没有那个数就表示NAN嘛。。。以前还真觉得这个好有道理来着。但是计算机这个东西你只能当做一个工具,也就是说它不能无中生有,它只能处理我们给它的东西,所有无穷大无穷小还有NAN在计算机里肯定有一种表示方式。

所以,一定还有非规格化的表示,也就是所谓的特殊情况。

第一:当E是8个0的时候,此时就不是(1.M)而是(0.M)了,这个时候就可以表示出0了,当然还可以表示那些非常接近0的数。

第二:当E是8个1的时候,如果小数域全是0,表示的是无穷,其余的表示NAN。

由上可知,指数部分为(0-127)和(255-127)的时候表示的是两种特殊情况,所以E的范围应该是【-126,127】。最后,得出的结论是规格化的浮点数的表示范围是 正负(2^127)*(2-2^(-23))=2^128-2^104=3.40*10^38

以上为个人经验,希望能给大家一个参考,也希望大家多多支持我们。

(0)

相关推荐

  • Java中双重检查锁(double checked locking)的正确实现

    目录 前言 加锁 双重检查锁 错误的双重检查锁 隐患 正确的双重检查锁 总结 前言 在实现单例模式时,如果未考虑多线程的情况,就容易写出下面的错误代码: public class Singleton { private static Singleton uniqueSingleton; private Singleton() { } public Singleton getInstance() { if (null == uniqueSingleton) { uniqueSingleton =

  • Java学习笔记:关于Java double类型相加问题

    目录 Java double类型相加问题 一.这个时候就要采用BigDecimal函数进行运算 二.double 三种加法比较 Java Double类详解 Double 类的构造方法 Double 类的常用方法 Double 类的常用常量 Java double类型相加问题 多个double类型的数直接相加的时候,可能存在精度误差.( 由于计算机算法以及硬件环境决定只能识别 0 1.计算机默认的计算结果在都在一个指定精度范围之内,想往深的了解,可以学习数值分析等) 在金融方面是绝对不允许的,好

  • Java double类型比较大小详解

    目录 Java double类型比较大小 一.问题描述 二.解决方法 关于两个double类型数的大小判断 Java double类型比较大小 一.问题描述 把从数据库里查询出来的数据,金额小于1的数据给过滤掉,数据库里的数据有很多都是0.01,0.02,等. 二.解决方法 先把他们转成BigDecimal类型,然后在利用BigDecimal中的compareTo方法去比较大小,实现如下: @org.junit.Test public void Test(){ BigDecimal big =

  • 聊聊Java Double相加出现的怪事

    目录 Java Double相加出现的怪事 问题的提出 解决方案 Double相加时出现的多位问题 Java Double相加出现的怪事 问题的提出 编译运行下面这个程序会看到什么 public class test { public static void main(String args[]) { System.out.println(0.05 + 0.01); System.out.println(1.0 - 0.42); System.out.println(4.015 * 100);

  • 详细谈谈Java中long和double的原子性

    目录 前言 JVM中对long的操作是不是原子操作? 为什么对long的操作不是原子的? 在硬件,操作系统,JVM都是64位的情况下呢? 总结 前言 java中基本类型中,long和double的长度都是8个字节,32位(4字节)处理器对其读写操作无法一次完成,那么,JVM,long和double是原子性的吗? JVM中对long的操作是不是原子操作? 首先,通过一段程序对long的原子性进行判断.测试程序如下: public class LongAtomTest implements Runn

  • java中int、double、char等变量的取值范围详析

    目录 1.java工具 2.代码简单框架 3.int 4.long 5.double 6.float 7.char 8.byte 9.short 10.总结 1.java工具 1.JDK:Java开发者工具,建议安装1.8版的. 2.IEDA:集成开发环境 2.代码简单框架 public为访问修饰限定符 class为类 HelloWorld为类的名称 public static void main(String[] args)相当于C语言的的main函数 System.out.println()

  • 关于Java float和double精度范围大小

    目录 Java float和double精度范围大小 一.小数的二进制转换(浮点数) 二.浮点数在计算机中的存储 三.指数位的偏移量与无符号表示 四.小结一下 float和double的范围到底是多少 Java float和double精度范围大小 要想理解float和double的取值范围和计算精度,必须先了解小数是如何在计算机中存储的: 举个例子:78.375,是一个正小数.要在计算机中存储这个数,需要把它表示为浮点数的格式,先执行二进制转换: 一.小数的二进制转换(浮点数) 78.375的

  • 关于Java float和double精度范围大小

    目录 Java float和double精度范围大小 一.小数的二进制转换(浮点数) 二.浮点数在计算机中的存储 三.指数位的偏移量与无符号表示 四.小结一下 float和double的范围到底是多少 总结一下上面的 Java float和double精度范围大小 要想理解float和double的取值范围和计算精度,必须先了解小数是如何在计算机中存储的: 举个例子:78.375,是一个正小数.要在计算机中存储这个数,需要把它表示为浮点数的格式,先执行二进制转换: 一.小数的二进制转换(浮点数)

  • 解决java数值范围以及float与double精度丢失的问题

    1.java中int,float,long,double取值范围 public class TestOutOfBound { public static void main(String[] args) { System.out.println(Integer.MAX_VALUE-(-Integer.MAX_VALUE)); //内存溢出 System.out.println(Integer.MAX_VALUE); //2的31次方-1,10个数位,正的20亿左右,用在钱上面不一定够 Syste

  • Java Float 保留小数位精度的实现

    目录 Float 保留小数位精度 Float 浮点型数据保留两位小数 1.DecimalFormat 2.Math.round(): Float 保留小数位精度 DecimalFormat decimalFormat=new DecimalFormat(".00"); return Float.valueOf(super.getDecimalFormat().format(new BigDecimal(handleTime))); Float 浮点型数据保留两位小数 用过两种方法:De

  • Java Float 保留小数位精度的实现

    目录 Float 保留小数位精度 Float 浮点型数据保留两位小数 1.DecimalFormat 2.Math.round() Float 保留小数位精度 DecimalFormat decimalFormat=new DecimalFormat(".00"); return Float.valueOf(super.getDecimalFormat().format(new BigDecimal(handleTime))); Float 浮点型数据保留两位小数 用过两种方法:Dec

  • 详解java中float与double的区别

    float是单精度类型,精度是8位有效数字,取值范围是10的-38次方到10的38次方,float占用4个字节的存储空间 double是双精度类型,精度是17位有效数字,取值范围是10的-308次方到10的308次方,double占用8个字节的存储空间 当你不声明的时候,默认小数都用double来表示,所以如果要用float的话,则应该在其后加上f 例如:float a=1.3; 则会提示不能将double转化成float  这成为窄型转化 如果要用float来修饰的话,则应该使用float a

  • 详解iOS之关于double/float数据计算精度问题

    1.我们的app有一个判断,当用户输入的值,小于等于剩余的余额时,给用户弹窗,代码不往下执行 当用户输入 0.01 时,po 一下的结果是:0.10000.... ,当用户的余额是0.01时,po一下网络请求的返回结果是:0.009999... 当用户输入 66.05时,po  一下的结果是:66.049999...,当用户的余额是66.05时,po一下网络请求的返回结果是:66.049999... 所以,当数据较大时,不会有影响,因为用户输入的数据和网络返回数据都被变成了不精确的小值了:但是,

  • Java BigDecimal和double示例及相关问题解析

    BigDecimal类 对于不需要任何准确计算精度的数字可以直接使用float或double,但是如果需要精确计算的结果,则必须使用BigDecimal类,而且使用BigDecimal类也可以进行大数的操作.BigDecimal类的常用方法如表1所示. 表1 BigDecimal类的常用方法 序号 方    法 类型 描    述 1 public BigDecimal(double val) 构造 将double表示形式转换 为BigDecimal 2 public BigDecimal(in

  • 浅谈MySQL中float、double、decimal三个浮点类型的区别与总结

    下表中规划了每个浮点类型的存储大小和范围: 类型 大小 范围(有符号) 范围(无符号) 用途 ==float== 4 bytes (-3.402 823 466 E+38,-1.175 494 351 E-38),0,(1.175 494 351 E-38,3.402 823 466 351 E+38) 0,(1.175 494 351 E-38,3.402 823 466 E+38) 单精度 浮点数值 ==double== 8 bytes (-1.797 693 134 862 315 7 E

随机推荐