HashMap底层原理全面详解面试绝对不慌

2025-02-22 13:38:00

快速入门

存储：put 方法 put(key,value)
查询 : get 方法 get(key)
java 代码如下

import java.util.HashMap;
import java.util.Map;

public class App {

   public static void main(String[] args) {
       Map<String,String> map = new HashMap<>();
       map.put("刘一","刘一");
       map.put("陈二","陈二");
       map.put("张三","张三");
       map.put("李四","李四");
       map.put("王五","王五");
       map.put("Money","我是猴哥Money老师");
       System.out.println(map.get("Money"));
   }
}
//输出结果：我是猴哥Money老师

技术的本质——底层结构

程序是等于我们的数据结构和算法

HashMap 其实就是做存储的，做存储的就是数据结构

在JDK7 : HashMap 是由数组，链表组成的
在JDK8: HashMap 是由数组，链表，红黑树组成的

存储是按上面的规则存储的，那查询是怎么查的了

算法：哈希算法

结构构成

既然要了解HashMap 的组成，就谈谈它的结构组成

首先我们来说下数组，数组在java 中是怎么定义的了

    //数组：采用一段连续的存储单元来存储数据的
    //数组的特点: 查询时间复杂度:0(1) ,删除,插入,时间负责度0(N),总结：查询块，插入慢
    public static void main(String [] args){
        //数组的定义：初始化长度为10，数据类型Integer ,
        Integer integer[] = new Integer[10];
        //指定下标，复制
        integer[0]=0;
        //指定下标，复制
        integer[1]=1;
        //指定下标，复制
        integer[9]=2;
        //指定下标，复制
        integer[9]=400;
        System.out.println(integer[9]);
    }
    // 输出结果：400

数组结构如图：

查询：时间复杂度 0（1）,查询非常快的
删除，插入：时间复杂度0（N）非常慢的，效率没有查询那么快

为什么查询快，插入，删除慢了？

查询快

是因为我们数组了都有一个序号,如图，0,1,2,3,4,5,… ，如果要找到下标为3的数据值, 这些序号其实就是他们的下标地址，可以理解为他们的一个下标索引，这个下标是连续的，是自增的，所以我们立马可以确定3个这个位置，根据这个索引3 找到它对应的节点。

插入，删除慢

假如我现在要出入一个Monkey 的数据，插入到3和4之间，如图

存在这个位置我们是没有下标的，则我们的下标4 则要移到 Monkey 那个位置，5下标就移到4那个位置，如图：

类似，我们后面的下标都要向左移动，这样我后面的数据是不是要做很大的改动，这样时间复杂度则为0（N），这样就保证了我们数组的连续性，同理删除的话如图：

数组后面数据的下标，都要还原成之前插入前的下标，后面的节点都要改变，这样我们可以看出，这就是数组，删除，插入为什么这么慢！
除非是插入，删除，数组的最后一个元素，大家懂了吗？还不懂那就私聊！

扩充：
大家知道我们java 哪一个类，底层用的就是数组？
在我们的java.util 包下面有一个ArrayList 类，如图

怎么验证了？
我们查看它的add 方法

   public boolean add(E var1) {
        this.ensureCapacityInternal(this.size + 1);
        this.elementData[this.size++] = var1;
        return true;
    }

如果面试被问到ArrayList 的特性，直接回答查询快，插入，删除慢

为什么要用链表

为什么HashMap 用到数组存储了，还要用到链表了？

谈谈什么是链表？
在java 中是这么定义的：

package node;

import com.sun.org.apache.bcel.internal.generic.IMPDEP1;

public class Node {

    public Node next;
    private Object data;

    public Node(Object next) {
        this.data = next;
    }

    //链表：链表是一种物理存储单元上非连续，非顺序的存储结构
    //特点: 插入，删除时间复杂度0(1) 查找遍历时间复杂度0(N) 总结：插入快,查询慢
    public static void main(String[] args){
        Node head =new Node("monkey");
        head.next =new Node("张三");
        head.next.next =new Node("刘一");
        System.out.println(head.data);
        System.out.println(head.next.data);
        System.out.println(head.next.next.data);
    }
}
//输出结果:
//monkey
//张三
//刘一

链表：链表是一种物理存储单元上非连续，非顺序的存储结构,如图：

为什么它插入，删除快，查询慢了？
删除某个节点，只需要上一个节点 head.next =null
插入某个几点，只需要上一个节点 head.next 指向插入的节点，插入的节点指向下一个节点
查询某个节点：链表查询都要通过头节点，比如我们要查‘刘一'，我们则要先查头monkey,再查张三，再查到刘一，
虽然只有3个节点，但是我们要查到刘一要查三次，把整个链表都遍历了一次，所以查询慢！

扩充
在我们java 中，哪一个util 类采用的链表来实现的?

我们来查看它的add 方法

   public boolean add(E var1) {
        this.linkLast(var1);
        return true;
    }
    //看上面有一个linkLast,如下:

   void linkLast(E var1) {
        LinkedList.Node var2 = this.last;
        LinkedList.Node var3 = new LinkedList.Node(var2, var1, (LinkedList.Node)null);
        this.last = var3;
        if (var2 == null) {
            this.first = var3;
        } else {
            var2.next = var3;
        }

        ++this.size;
        ++this.modCount;
    }
    //看上面有一个Node,如下:
    private static class Node<E> {
        E item;
        LinkedList.Node<E> next;
        LinkedList.Node<E> prev;

        Node(LinkedList.Node<E> var1, E var2, LinkedList.Node<E> var3) {
            this.item = var2;
            this.next = var3;
            this.prev = var1;
        }
    }
	  //上面有一个next,有一个prev
	  //这是一个双向链表

双向链表如图: 类似与分页，上一页，下一页，下面的对象也可以获取上面对象的数据（head.prev）

现在大家都已经了解JDK7 HashMap 数据结构了，开始了解下算法！

哈希算法

那么HashMap 是怎么去存储的了？他是如何将数据放到我们的数组和链表上的？
用的就是哈希算法，你们知道哈希算法的底层是怎么实现的？
哈希表

什么是哈希算法？
哈希算法（也叫散列），就是把任意长度值（key）通过散列算法变换成固定长度的key(地址)，通过这个地址进行访问的数据结构，
它通过把关键码值映射到表中一个位置来访问记录，以加快查找速度。

例如图中的John Smith 通过散列算法变换成固定长度的key:152 （永远是152），然后通过152 变成John Smith 是不可能的，哈希算法是不可逆的。
HashCode: 通过字符串算出它的ascii 码，进行mod(取模)，算出哈希表中的下标

代码如下：

public class AsciiCode {

    public static void main(String[] args) {
        char c [] ="lies".toCharArray();
        for (int i = 0; i < c.length; i++) {
            System.out.println((c[i])+":" +(int)c[i]);
        }
    }

}
//输出结果：
//l:108
//i:105
//e:101
//s:115

将 lies 算出来的ascii 码相加然后除以10 取模（为什么取模不直接存储 429了）
为什么取模不直接存储 429了？
//数组是采用一段连续的存储单元来存储数据的，那存lies 数据将如图：

如果你要存lies 则需要300 个这样的内存空间，所以我们取模为10，算出来的值为 9，则节省了很多空间，我们取模的目的就是节省内存空间！

如果我们取模会出现什么问题
会出现hash 冲突(碰撞)的一个问题,

什么是hash冲突

lies 的值通过ascii 码计算的总和为 429foes 的值通过ascii 码计算的总和也为 429

两个单词取模后的值都是 9 ，则lies 会存在下标为9 的这个位置，foes 也存在下标为9 的这个位置，而数组存在同一个下标下面是会覆盖的（上面代码讲数组的时候Intergers[9]=400,会覆盖Intergers[9]=2 的值，最终Intergers[9] =400）,同样我们先存的是lies 后存的是foes,则lies
将会被覆盖，lies 和foes 是不同的key, 我们HashMap 是可以存这两个值的，为什么没有被覆盖了？这个地方就叫做哈希碰撞！

Hash冲突怎么解决了
我们用链表来解决这个问题, 链表是有一个指针的，我们可以让这个lies 指向这个foes,我们让foes 去匹配下标为9 的这个节点，如果匹配lies 不相等，则去匹配下一个节点foes,最终就会找到这个foes,这就是我们hash 算法底层的原理及解决冲突。

手写HashMap

不调用JDK7 的HashMap,自己手动写一个HashMap

public class App {

    public static void main(String[] args) {
       //Map<String,String> map = new HashMap<>();
        App map = new App();
        map.put("刘一","刘一");
        map.put("陈二","陈二");
        map.put("张三","张三");
        map.put("李四","李四");
        map.put("王五","王五");
        map.put("Money","我是猴哥Money老师");
        //System.out.println(map.get("Money"));
    }

public void put(String key,String value){
 System.out.printf("key:%s:::::::::::::::;::hash值:%s:::::::::::::::::::存储位置:%s\r\n",key,key.hashCode(),Math.abs(key.hashCode() % 15));
    }
}
//输出结果:
//    key:刘一:::::::::::::::;::hash值:671464:::::::::::::::::::存储位置:4
//    key:陈二:::::::::::::::;::hash值:1212740:::::::::::::::::::存储位置:5
//    key:张三:::::::::::::::;::hash值:774889:::::::::::::::::::存储位置:4
//    key:李四:::::::::::::::;::hash值:842061:::::::::::::::::::存储位置:6
//    key:王五:::::::::::::::;::hash值:937065:::::::::::::::::::存储位置:0
//    key:Monkey:::::::::::::::;::hash值:-1984628749:::::::::::::::::::存储位置:4

我们多次运行，运行的结果还是这样，这就是hash 算法的一个特点：它是一个幂等性的一个算法

模拟我们是怎么存值的
我们一组数据就是 key,value , 可以用string,int 来存吗？这里显然不能，我们一般存这种值一般用对象来存值，我在这里随便命名用个Object或者叫Entry 对象，其实我们还要存另外两个值？（hash和next），当发生hash 冲突的时候（存储位置4） next 可以指向下一个节点，hash 值是用来比较的,比较hashCode 值是否相等！

存取结构图如下：

上面的图形结构，我们就知道如何存数据了！

那我们该如何取数据了？
-假如我们要取‘刘一' 的值

我们通过get(key) 方法获取数据的模，然后根据key,与hashCode 的值去比较下标为4 的key 和hashCode,查看是否相等，如果不相等我们通过next 方法比较下一个节点的数据，直到 key 与hashCode 对比的值都相等，此时，获取value的值就是当前key 所对应的value!

HashMap底层的实现

HashMap 底层如何实现的了？我们用写源码的方式验证

模拟java HashMap

定义一个Map 接口

/**
 * 自己手动定义Map
 * @param <K>
 * @param <V>
 */
public interface Map<K,V> {

    V put(K k,V v);

    V get(K k);

    int size();

     interface  Entry<K,V>{
      K getKey();
      V getValue();
     }

}

定义一个实现Map 的HashMap

import sun.management.snmp.jvmmib.JvmRTInputArgsTableMeta;

/**
 * 自己定义HashMap
 * @param <K>
 * @param <V>
 */
public class HashMap<K,V> implements Map<K,V>{

    //存储元素对象
    private Entry<K,V> table[] = null;

    //扩容初始化
    int size =0;

    //初始化存储元素对象大小
    public HashMap() {
        this.table = new Entry[16];
    }

    /**
     * 1.通过key hash 算法算出hash值,然后取模
     * 2.取模后就有对应的index 数组下标,然后存储对象<Entry>
     * 3.判断当前对象是否为空，如果空，直接存储，
     * 4.如果不为空，我们就要用到next 链表
     * 5.返回当前这个节点
     * @param k
     * @param v
     * @return
     */
    @Override
    public V put(K k, V v) {
       int index = hash(k);
       Entry<K,V> entry = table[index];
       if(null ==entry){
           //刘一，陈二，李四，王五 就开始存在这个entry,每个entry 对象则存储到了对应table 中
           table[index] = new Entry<>(k, v, index, null);
           size++;
       }else{
           //冲突了，张三，Monkey
           table[index] = new Entry<>(k, v, index, entry);
       }

        return table[index].getValue();
    }

    private int hash(K k) {
        //HashMap 底层用到的是移位的操作，性能高很多 >>,我们这里就直接取模
        int index =k.hashCode() % 16;
        //Math.abs(index);
        return index>0?index:-index;
    }

    /**
     * 1.通过 key 进行hash 运算，取模，找到数组对应的下标 index
     * 2.判断当前对象是否为空,如果不为空
     * 3.判断是否相等，如果不相等
     * 4.判断next 是否为空，如果不为空，
     * 5.再判断相等，知道相等为止，或者为空为止
     * 6.然后返回
     *
     *
     *
     * @param k
     * @return
     */
    @Override
    public V get(K k) {
        //如果没有存储数据那size 为0，也不用查了，直接返回null
        if(size ==0){
            return null;
        }
        int index = hash(k);
        Entry<K, V> entry = findValue(table[index], k);
        //通过index 找打这个对象
        return entry==null?null:entry.getValue();
    }

    /**
     *
     * @param entry
     * @param k 查询刘一
     * @return
     */
    private Entry<K,V> findValue(Entry<K,V> entry,K k) {
        //存的可能是数值类型，也可能是字符串类型
        if (k.equals(entry.getKey()) || k == entry.getKey()) {
            return entry;
            //如果不相等，估计这个节点是个链表，判断它next 数据是否匹配
        } else {
            if(entry.next !=null){
                //用到递归，在链表里面一直查询这个k,值是否相等
                return findValue(entry.next,k);
            }
        }
        return null;
    }

    @Override
    public int size() {
        return size++;
    }

    class Entry<K,V> implements Map.Entry<K,V>{

         //存四个值
        K k;
        V v;
        int hash;
        Entry<K,V> next;

        public Entry(K k, V v, int hash, Entry<K, V> next) {
            this.k = k;
            this.v = v;
            this.hash = hash;
            this.next = next;
        }

        @Override
        public K getKey() {
            return k;
        }

        @Override
        public V getValue() {
            return v;
        }
    }

}

定义一个测试类

public class Test {

    public static void main(String[] args) {
        Map<String,String> map = new HashMap<>();
        map.put("Monkey","我是moneky老师");
        map.put("东山再起","东山再起是位好同学");
        System.out.println(map.get("Monkey"));
        System.out.println(map.get("东山再起"));
    }

//输出结果:
//我是moneky老师
//东山再起是位好同学
}

查看到测试结果，我们就能看到HashMap ，是怎么存储的，和获取值的！

但是JDK8 用的是红黑树，为什么了？
举个代码的例子

import com.sun.xml.internal.ws.api.model.wsdl.WSDLOutput;

public class Test {

    public static void main(String[] args) {
        Map<String,String> map = new HashMap<>();
        for (int i = 0; i < 1000; i++) {
            map.put("Monkey"+i,"我是moneky老师"+i);
        }
        System.out.println(map);
    }
}

可以看到这个map 的size 只有16，却存了很多的数据：

容量不够，我们就只能把这个数据放到链表上，链表无线延长，这种hash冲突是十分严重的，而链表的特性是查询慢，而链表又无线延长，我们查询链表末端的数据，这样性能就很低了，所以JDK8 就用红黑树了！

总结：解决链表过长查询效率过低的问题

什么情况下用红黑树?

前提条件
阈值 8

HashMap 类下面有个这个：

  static final int TREEIFY_THRESHOLD = 8;

为什么要阈值是8 了？

因为红黑叔插入慢，他要判断小中大（也就是左边的小于右边的），而链表插入快，删除快，但是为什么是 8 不是 6了？

具体原因请参考这篇Java红黑树的数据结构与算法解析

到此这篇关于HashMap底层原理全面详解面试绝对不慌的文章就介绍到这了,更多相关HashMap底层原理内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

剖析Java中HashMap数据结构的源码及其性能优化

存储结构首先,HashMap是基于哈希表存储的.它内部有一个数组,当元素要存储的时候,先计算其key的哈希值,根据哈希值找到元素在数组中对应的下标.如果这个位置没有元素,就直接把当前元素放进去,如果有元素了(这里记为A),就把当前元素链接到元素A的前面,然后把当前元素放入数组中.所以在Hashmap中,数组其实保存的是链表的首节点.下面是百度百科的一张图: 如上图,每个元素是一个Entry对象,在其中保存了元素的key和value,还有一个指针可用于指向下一个对象.所有哈希值相同的key(也就
详解 Java HashMap 实现原理

HashMap 是 Java 中最常见数据结构之一,它能够在 O(1) 时间复杂度存储键值对和根据键值读取值操作.本文将分析其内部实现原理(基于 jdk1.8.0_231). 数据结构 HashMap 是基于哈希值的一种映射,所谓映射,即可以根据 key 获取到相应的 value.例如:数组是一种的映射,根据下标能够取到值.不过相对于数组,HashMap 占用的存储空间更小,复杂度却同样为 O(1). HashMap 内部定义了一排"桶",用一个叫 table 的 Node 数组表示:
java中hashmap的底层数据结构与实现原理

目录 Hash结构 HashMap实现原理为何HashMap的数组长度一定是2的次幂? 重写equals方法需同时重写hashCode方法总结 Hash结构 HashMap根据名称可知,其实现方法与Hash表有密切关系.在讨论哈希表之前,我们先大概了解下其他数据结构在新增,查找等基础操作执行性能. 数组:采用一段连续的存储单元来存储数据.对于指定下标的查找,时间复杂度为O(1):通过给定值进行查找,需要遍历数组,逐一比对给定关键字和数组元素,时间复杂度为O(n),当然,对于有序数组,则可采用
Java数据结构-HashMap详解

Java数据结构-HashMap 1. HashMap数据结构没有哈希冲突时,为数组,支持动态扩容哈希冲突时,分为两种情况: 1.当冲突长度小于8或数组长度小于64(MIN_TREEIFY_CAPACITY默认值为64)时,为数组+链表(Node) 2.当冲突长度大于8时,为数组+红黑树/链表(TreeNode). 红黑树用于快速查找,链表用于遍历. 2. 红黑树 HashMap中的TreeNode是红黑树的实现. TreeNode几个方法 1. 左旋转 static <K,V> Tree
Java LinkedHashMap 底层实现原理分析

在实现上,LinkedHashMap很多方法直接继承自HashMap,仅为维护双向链表覆写了部分方法.所以,要看懂 LinkedHashMap 的源码,需要先看懂 HashMap 的源码. 默认情况下,LinkedHashMap的迭代顺序是按照插入节点的顺序.也可以通过改变accessOrder参数的值,使得其遍历顺序按照访问顺序输出. 这里我们只讨论LinkedHashMap和HashMap的不同之处,LinkedHashMap的其他操作和特性具体请参考HashMap 我们先来看下两者的区别:
HashMap底层实现原理详解

一.快速入门示例:有一定基础的小伙伴们可以选择性的跳过该步骤 HashMap是Java程序员使用频率最高的用于映射键值对(key和value)处理的数据类型.随着JDK版本的跟新,JDK1.8对HashMap底层的实现进行了优化,列入引入红黑树的数据结构和扩容的优化等.本文结合JDK1.7和JDK1.8的区别,深入探讨HashMap的数据结构实现和功能原理. Java为数据结构中的映射定义了一个接口java.uti.Map,此接口主要有四个常用的实现类,分别是HashMap,LinkedHas
HashMap底层原理全面详解面试绝对不慌

目录快速入门技术的本质--底层结构结构构成为什么要用链表哈希算法手写HashMap HashMap底层的实现什么情况下用红黑树? 快速入门存储:put 方法 put(key,value) 查询 : get 方法 get(key) java 代码如下 import java.util.HashMap; import java.util.Map; public class App { public static void main(String[] args) { Map<Strin
Java CAS底层实现原理实例详解

这篇文章主要介绍了Java CAS底层实现原理实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下一.CAS(compareAndSwap)的概念 CAS,全称Compare And Swap(比较与交换),解决多线程并行情况下使用锁造成性能损耗的一种机制. CAS(V, A, B),V为内存地址.A为预期原值,B为新值.如果内存地址的值与预期原值相匹配,那么将该位置值更新为新值.否则,说明已经被其他线程更新,处理器不做任何操作:无论哪种情
Android Binder 通信原理图文详解

目录前言 1. Binder的作用 2. 进程与Binder驱动如何通信 3. ServiceManager进程的作用 Binder Client.Binder Server.ServiceManager关系 ServiceManager注册进Binder 4. 进程添加服务到ServiceManager的流程其它进程找到SM 添加服务到ServiceManager BBinder作用 5. 进程从ServiceManager获取服务的流程其它进程找到SM 从ServiceManager获
jQuery 跨域访问解决原理案例详解

浏览器端跨域访问一直是个问题,多数研发人员对待js的态度都是好了伤疤忘了疼,所以病发的时候,时不时地都要疼上一疼.记得很久以前使用iframe 加script domain 声明.yahoo js util 的方式解决二级域名跨域访问的问题. 时间过得好快,又被拉回js战场时, 跨域问题这个伤疤又开疼了.好在,有jQuery帮忙,跨域问题似乎没那么难缠了.这次也借此机会对跨域问题来给刨根问底,结合实际的开发项目,查阅了相关资料,算是解决了跨域问题...有必要记下来备忘, 跨域的安全限制都是指浏览
Java包装类的缓存机制原理实例详解

这篇文章主要介绍了Java包装类的缓存机制原理实例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 java 包装类的缓存机制,是在Java 5中引入的一个有助于节省内存.提高性能的功能,只有在自动装箱时有效 Integer包装类举个栗子: Integer a = 127; Integer b = 127; System.out.println(a == b); 这段代码输出的结果为true 使用自动装箱将基本类型转为封装类对象这个过程其实
Spring AOP底层源码详解

ProxyFactory的工作原理 ProxyFactory是一个代理对象生产工厂,在生成代理对象之前需要对代理工厂进行配置.ProxyFactory在生成代理对象之前需要决定到底是使用JDK动态代理还是CGLIB技术. // config就是ProxyFactory对象 // optimize为true,或proxyTargetClass为true,或用户没有给ProxyFactory对象添加interface if (config.isOptimize() || config.isProxy
java方法及this关键字原理分析详解

目录步骤1 .给顾客增加一个吃饭的方法步骤 2 . 没有加static的属性和方法,一定需要先new对象步骤 3 . 用new出来的对象去执行eat方法步骤 4 . 怎么理解c.eat() 步骤 5 . 消息接受器步骤 6 . 如果有两个顾客? 步骤 7 . 答案步骤 8 .其实有个this 步骤 9 . 在eat方法里面直接使用this 步骤 10 . 构造方法步骤 11 . 总结:this的意义是什么? 步骤 12 . 道理我都懂,那static又是什么? 步骤 13 . 本节
Kotlin协程Dispatchers原理示例详解

目录前置知识 demo startCoroutineCancellable intercepted()函数 DefaultScheduler中找dispatch函数 Runnable传入 Worker线程执行逻辑小结前置知识 Kotlin协程不是什么空中阁楼,Kotlin源代码会被编译成class字节码文件,最终会运行到虚拟机中.所以从本质上讲,Kotlin和Java是类似的,都是可以编译产生class的语言,但最终还是会受到虚拟机的限制,它们的代码最终会在虚拟机上的某个线程上被执行. 之
GoLang strings.Builder底层实现方法详解

目录 1.strings.Builder结构体 1.1strings.Builder结构体 1.2Write方法 1.3WriteByte方法 1.4WriteRune方法 1.5.WriteString方法 1.6String方法 1.7Len方法 1.8Cap方法 1.9Reset方法 1.10Grow方法 1.11grow方法 1.12copyCheck方法 2.strings.Builder介绍 3.存储原理 4.拷贝问题 5.不能与nil作比较 6.Grow深入 7.不支持并行读写 1
前端JS图片懒加载原理方案详解

目录背景原理方案方案一:img的loading属性设为“lazy” 使用方法优点兼容性缺点方案二:通过offsetTop来计算是否在可视区域内优化优点缺点方案三:通过getBoundingClientRect来计算是否在可视区域内方案四:使用IntersectionObserver来判断是否在可视区域内兼容性优点缺点问题布局抖动响应式图片 SEO不友好插件背景懒加载经常出现在前端面试中,是前端性能优化的常用技巧.懒加载也叫延迟加载,把非关键资源先不加载