Java面试题之HashSet的实现原理

2026-02-19 13:00:40

HashSet 的实现原理？

首先，我们需要知道它是Set的一个实现，所以保证了当中没有重复的元素。
一方面Set中最重要的一个操作就是查找。而且通常我们会选择

HashSet来实现，因为它专门对快速查找进行了优化。

HashSet使用的是散列函数，那么它当中的元素也就无序可寻。当中是允许元素为null的。

先对实现原理进行一个总结：
（1）基于HashMap实现的，默认构造函数是构建一个初始容量为16，负载因子为0.75 的HashMap。封装了一个 HashMap 对象来存储所有的集合元素，所有放入 HashSet 中的集合元素实际上由 HashMap 的 key 来保存，而 HashMap 的 value 则存储了一个 PRESENT，它是一个静态的 Object 对象。

（2）当我们试图把某个类的对象当成 HashMap的 key，或试图将这个类的对象放入 HashSet 中保存时，重写该类的equals(Object obj)方法和 hashCode() 方法很重要，而且这两个方法的返回值必须保持一致：当该类的两个的 hashCode() 返回值相同时，它们通过 equals() 方法比较也应该返回 true。通常来说，所有参与计算 hashCode() 返回值的关键属性，都应该用于作为 equals() 比较的标准。

（3）HashSet的其他操作都是基于HashMap的。

在这，为大家讲解HashSet 的实现原理：

它是基于HashMap实现的，HashSet底层使用HashMap来保存所有元素，因此HashSet 的实现比较简单，相关HashSet的操作，基本上都是直接调用底层HashMap的相关方法来完成， HashSet的源代码如下：

import java.util.AbstractSet;
import java.util.Collection;
import java.util.HashMap;
import java.util.LinkedHashMap;
import java.util.Set;

import javax.swing.text.html.HTMLDocument.Iterator;

public class HashSet<E>
     extends AbstractSet<E>
     implements Set<E>, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L; 

// 底层使用HashMap来保存HashSet中所有元素。
private transient HashMap<E,Object> map; 

// 定义一个虚拟的Object对象作为HashMap的value，将此对象定义为static final。
private static final Object PRESENT = new Object(); 

// 默认的无参构造器，构造一个空的HashSet。
//
// 实际底层会初始化一个空的HashMap，并使用默认初始容量为16和加载因子0.75。 

public HashSet() {
map = new HashMap<E,Object>();
} 

// 构造一个包含指定collection中的元素的新set。
//
// 实际底层使用默认的加载因子0.75和足以包含指定
// collection中所有元素的初始容量来创建一个HashMap。
// @param c 其中的元素将存放在此set中的collection。 

public HashSet(Collection<? extends E> c) {
map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
} 

// 以指定的initialCapacity和loadFactor构造一个空的HashSet。
//
// 实际底层以相应的参数构造一个空的HashMap。
// @param initialCapacity 初始容量。
// @param loadFactor 加载因子。 

public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<E,Object>(initialCapacity, loadFactor);
} 

// 以指定的initialCapacity构造一个空的HashSet。
//
// 实际底层以相应的参数及加载因子loadFactor为0.75构造一个空的HashMap。
// @param initialCapacity 初始容量。 

public HashSet(int initialCapacity) {
map = new HashMap<E,Object>(initialCapacity);
} 

// 以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。
// 此构造函数为包访问权限，不对外公开，实际只是是对LinkedHashSet的支持。
//
// 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。
// @param initialCapacity 初始容量。
// @param loadFactor 加载因子。
// @param dummy 标记。 

HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
} 

// 返回对此set中元素进行迭代的迭代器。返回元素的顺序并不是特定的。
//
// 底层实际调用底层HashMap的keySet来返回所有的key。
// 可见HashSet中的元素，只是存放在了底层HashMap的key上，
// value使用一个static final的Object对象标识。
// @return 对此set中元素进行迭代的Iterator。 

 public Iterator<E> iterator() {
   return map.keySet().iterator(); 

} 

// 返回此set中的元素的数量（set的容量）。
//
// 底层实际调用HashMap的size()方法返回Entry的数量，就得到该Set中元素的个数。
// @return 此set中的元素的数量（set的容量）。 

public int size() {
return map.size();
} 

// 如果此set不包含任何元素，则返回true。
//
// 底层实际调用HashMap的isEmpty()判断该HashSet是否为空。
// @return 如果此set不包含任何元素，则返回true。 

public boolean isEmpty() {
return map.isEmpty();
} 

// 如果此set包含指定元素，则返回true。
// 更确切地讲，当且仅当此set包含一个满足(o==null ? e==null : o.equals(e))
// 的e元素时，返回true。
//
// 底层实际调用HashMap的containsKey判断是否包含指定key。
// @param o 在此set中的存在已得到测试的元素。
// @return 如果此set包含指定元素，则返回true。 

public boolean contains(Object o) {
return map.containsKey(o);
} 

// 如果此set中尚未包含指定元素，则添加指定元素。
// 更确切地讲，如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))
// 的元素e2，则向此set 添加指定的元素e。
// 如果此set已包含该元素，则该调用不更改set并返回false。
//
// 底层实际将将该元素作为key放入HashMap。
// 由于HashMap的put()方法添加key-value对时，当新放入HashMap的Entry中key
//与集合中原有Entry的key相同（hashCode()返回值相等，通过equals比较也返回true），
//新添加的Entry的value会将覆盖原来Entry的value，但key不会有任何改变，
// 因此如果向HashSet中添加一个已经存在的元素时，新添加的集合元素将不会被放入HashMap中，
// 原来的元素也不会有任何改变，这也就满足了Set中元素不重复的特性。
// @param e 将添加到此set中的元素。
// @return 如果此set尚未包含指定元素，则返回true。 

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
} 

// 如果指定元素存在于此set中，则将其移除。
// 更确切地讲，如果此set包含一个满足(o==null ? e==null : o.equals(e))的元素e，
// 则将其移除。如果此set已包含该元素，则返回true
// （或者：如果此set因调用而发生更改，则返回true）。（一旦调用返回，则此set不再包含该元素）。
//
// 底层实际调用HashMap的remove方法删除指定Entry。
// @param o 如果存在于此set中则需要将其移除的对象。
// @return 如果set包含指定元素，则返回true。 

public boolean remove(Object o) {
return map.remove(o)==PRESENT;
} 

// 从此set中移除所有元素。此调用返回后，该set将为空。
//
// 底层实际调用HashMap的clear方法清空Entry中所有元素。 

public void clear() {
map.clear();
} 

// 返回此HashSet实例的浅表副本：并没有复制这些元素本身。 

// 底层实际调用HashMap的clone()方法，获取HashMap的浅表副本，并设置到HashSet中。 

public Object clone() {
  try {
    HashSet<E> newSet = (HashSet<E>) super.clone();
    newSet.map = (HashMap<E, Object>) map.clone();
    return newSet;
  } catch (CloneNotSupportedException e) {
    throw new InternalError();
  }
}
}

谢谢，请大家批评指正！

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持我们。

Java面试题从源码角度分析HashSet实现原理

面试官:请问HashSet有哪些特点? 应聘者:HashSet实现自set接口,set集合中元素无序且不能重复: 面试官:那么HashSet 如何保证元素不重复? 应聘者:因为HashSet底层是基于HashMap实现的,当你new一个HashSet时候,实际上是new了一个map,执行add方法时,实际上调用map的put方法,value始终是PRESENT,所以根据HashMap的一个特性: 将一个key-value对放入HashMap中时,首先根据key的hashCode()返回值决定该E
HashSet工作原理_动力节点Java学院整理

对于 HashSet 而言,它是基于 HashMap 实现的,HashSet 底层采用 HashMap 来保存所有元素,因此 HashSet 的实现比较简单,查看 HashSet 的源代码,可以看到如下代码: public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable { // 使用 HashMap 的 key 保存 HashSet 中
Java面试题之HashSet的实现原理

HashSet 的实现原理? 首先,我们需要知道它是Set的一个实现,所以保证了当中没有重复的元素. 一方面Set中最重要的一个操作就是查找.而且通常我们会选择 HashSet来实现,因为它专门对快速查找进行了优化. HashSet使用的是散列函数,那么它当中的元素也就无序可寻.当中是允许元素为null的. 先对实现原理进行一个总结: (1)基于HashMap实现的,默认构造函数是构建一个初始容量为16,负载因子为0.75 的HashMap.封装了一个 HashMap 对象来存储所有的集合元素,
Java面试题之HashMap 的 hash 方法原理是什么

Warning:这是<Java 程序员进阶之路>专栏的第 55 篇. 回来后小二找到了我,于是我就写下了这篇文章丢给他,并严厉地告诉他:再搞不懂就别来找我.听到这句话,心头一阵酸,小二绷不住差点要哭
Java 面试题和答案 -（上）

本文我们将要讨论Java面试中的各种不同类型的面试题,它们可以让雇主测试应聘者的Java和通用的面向对象编程的能力.下面的章节分为上下两篇,第一篇将要讨论面向对象编程和它的特点,关于Java和它的功能的常见问题,Java的集合类,垃圾收集器,第二篇主要讨论异常处理,Java小应用程序,Swing,JDBC,远程方法调用(RMI),Servlet和JSP. 开始! 目录面向对象编程(OOP) 常见的Java问题 Java线程 Java集合类垃圾收集器面向对象编程(OOP) Java是一个支持
阿里、华为、腾讯Java技术面试题精选

阿里.华为.腾讯Java技术面试题精选,具体内容如下 JVM的类加载机制是什么?有哪些实现方式? 类加载机制: 类的加载指的是将类的.class文件中的二进制数据读入到内存中,将其放在运行时数据区的方法去内,然后在堆区创建一个java.lang.Class对象,用来封装在方法区内的数据结构.类的加载最终是在堆区内的Class对象,Class对象封装了类在方法区内的数据结构,并且向Java程序员提供了访问方法区内的数据结构的接口. 类加载有三种方式: 1)命令行启动应用时候由JVM初始化加载 2)
百度Java面试题前200页精选（上）

百度"Java面试题"前200页精选上篇基本概念操作系统中 heap 和 stack 的区别什么是基于注解的切面实现什么是对象/关系映射集成模块什么是 Java 的反射机制什么是 ACID BS与CS的联系与区别 Cookie 和 Session的区别 fail-fast 与 fail-safe 机制有什么区别 get 和 post请求的区别 Interface 与 abstract 类的区别 IOC的优点是什么 IO 和 NIO的区别,NIO优点 Java 8 / J
Java面试题冲刺第三天--集合框架篇

目录面试题1:对比 Vector.ArrayList.LinkedList 有何区别?适合在什么场景下使用正经回答: 深入追问: 追问1:多线程场景下就不能使用ArrayList么? 追问2:说一下 HashSet 的实现原理? 追问3:HashSet是如何保证Key不重复的? 面试题2:List 和 Set 有哪些区别? 正经回答: 面试题3:Array 和 ArrayList 有何区别? 正经回答: 总结面试题1:对比 Vector.ArrayList.LinkedList 有何区别?
最有价值的50道java面试题适用于准入职Java程序员

下面的内容是对网上原有的Java面试题集及答案进行了全面修订之后给出的负责任的题目和答案,原来的题目中有很多重复题目和无价值的题目,还有不少的参考答案也是错误的,修改后的Java面试题集参照了JDK最新版本,去掉了EJB 2.x等无用内容,补充了数据结构和算法相关的题目.经典面试编程题.大型网站技术架构.操作系统.数据库.软件测试.设计模式.UML等内容,同时还对很多知识点进行了深入的剖析,例如hashCode方法的设计.垃圾收集的堆和代.Java新的并发编程.NIO.2等,相信对准备入职的Ja
Java面试题及答案集锦（基础题122道，代码题19道）

Java基础面试题及答案集锦(基础题122道,代码题19道),具体详情如下所示: 1.面向对象的特征有哪些方面 1.抽象: 抽象就是忽略一个主题中与当前目标无关的那些方面,以便更充分地注意与当前目标有关的方面.抽象并不打算了解全部问题,而只是选择其中的一部分,暂时不用部分细节.抽象包括两个方面,一是过程抽象,二是数据抽象. 2.继承: 继承是一种联结类的层次模型,并且允许和鼓励类的重用,它提供了一种明确表述共性的方法.对象的一个新类可以从现有的类中派生,这个过程称为类继承.新类继承了原始类的特性
百度Java面试题前200页精选（下）

百度"Java面试题"前200页精选下篇设计模式什么是设计模式(Design Patterns)?你用过哪种设计模式?用在什么场合你知道哪些商业级设计模式? 哪些设计模式可以增加系统的可扩展性单例模式除了单例模式,你在生产环境中还用过什么设计模式? 写 Singleton 单例模式单例模式的双检锁是什么如何创建线程安全的 Singleton 什么是类的单例模式写出三种单例模式实现适配器模式适配器模式是什么?什么时候使用适配器模式和代理模式之前有什么不同适配器模式
Java面试题解析之判断以及防止SQL注入

本文研究的主要是Java面试题中的一个比较常见的题目,判断及防止SQL注入的问题,具体介绍如下. SQL注入是目前黑客最常用的攻击手段,它的原理是利用数据库对特殊标识符的解析强行从页面向后台传入.改变SQL语句结构,达到扩展权限.创建高等级用户.强行修改用户资料等等操作. 那怎么判断是否被SQL注入了呢? 通过SQL注入的原理我们知道,判断SQL注入可以通过页面传入的数据,后台不应该相信从后台传入的任何数据特别是特殊整型参数和特殊字符参数! 防止SQL注入其实也很简单 1.检查变量数据类型和格式

Java面试题之HashSet的实现原理

相关推荐

随机推荐