java开放地址法和链地址法解决hash冲突的方法示例

hashMap对各位小伙们来说,没有不知道的了,使用过的人想必或多或少的都了解一点hashMap的底层实现原理,总结来说就是,数组+链表,至于源码的实现,大家可参看源码,今天想说的是hashMap是怎么解决hash冲突的呢?

首先看一张图,

从这张图也大概可以看出来,hashMap维护的是一个数组,数组里面的每个单元又是一个个链表,那么为什么会产生hash冲突呢?这也就是接下来要探讨的问题。

既是数组,必然会有长度,当我们在往数组中插入数据的时候,不管是什么类型的数据,对于数组来说,就是占据了某个下标对应的空间,那么当加入的数据越来越多的时候,是否会出现多个数据占据同一个位置呢?答案是肯定的,这就是hash冲突产生的原始因素;

首先,我们先弄清楚几个概念,对于hashMap或者其他类似的map来说,我们往里面添加数据的时候,并不是直接往数组里面加,而是通过计算这个插入数据的hash值,即通过一个hash的算法,然后把这个值加进去,以后再去查找数据的时候,hashMap同样会根据你的key,倒推出这个hash值然后取出数据,即这个hash值可以理解为插入值对应的数组下表;

但通过实验我们可以发现,hash函数计算不同的key的时候,可能得到相同的hash值,这样一来,如果再用这个hash值作为数组的标识这个值的下标,就无法定位这个值了,这个时候冲突就发生了;

下面我们用代码来模拟一下这个使用开发地址法解决hash冲突的问题,首先定义一个对象,这里为Info,为了更接近真实场景,我们这里的属性都为字符串,

什么是开放地址法呢?

当冲突发生的时候,通过查找数组的一个空位,将数据插入进去,而不再用hash函数计算获取数的下标,这个方法就叫做开发地址法;

public class Info {
	private String key;			//关键字,或者能标识对象的唯一属性
	private String name;		//值域

	public Info(String key, String name) {
		this.key = key;
		this.name = name;
	}

	public String getKey() {
		return key;
	}

	public void setKey(String key) {
		this.key = key;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}
}

接下来手工写一个hashTable,用于模拟hashMap,

/**
 * 模拟hashMap
 *
 */
public class HashTable {

	private Info[] arr;

	/**
	 * 默认的构造方法
	 */
	public HashTable() {
		arr = new Info[100];
	}

	/**
	 * 指定数组初始化大小
	 */
	public HashTable(int maxSize) {
		arr = new Info[maxSize];
	}

	/**
	 * 插入数据
	 */
	public void insert(Info info) {
		//获得关键字
		String key = info.getKey();
		//关键字所自定的哈希数
		int hashVal = hashCode(key);
		//如果这个索引已经被占用,而且里面是一个未被删除的数据
		while(arr[hashVal] != null && arr[hashVal].getName() != null) {
			//进行递加,避免漏找
			++hashVal;
			//循环
			hashVal %= arr.length;
		}
		arr[hashVal] = info;
	}

	/**
	 * 查找数据
	 */
	public Info find(String key) {
		int hashVal = hashCode(key);
		while(arr[hashVal] != null) {
			if(arr[hashVal].getKey().equals(key)) {
				return arr[hashVal];
			}
			++hashVal;
			hashVal %= arr.length;
		}
		return null;
	}

	/**
	 * 删除数据
	 */
	public Info delete(String key) {
		int hashVal = hashCode(key);
		//循环查找,数组中下标为hashVal的值,没有找到返回null
		while(arr[hashVal] != null) {
			if(arr[hashVal].getKey().equals(key)) {
				Info tmp = arr[hashVal];
				tmp.setName(null);
				return tmp;
			}
			++hashVal;			//由于数组的值是连续的,为了避免漏找,需要依次往下找
			hashVal %= arr.length;
		}
		return null;
	}

	/**
	 * 获得关键字的hash值,也可以自定义
	 */
	public int hashCode(String key) {

		BigInteger hashVal = new BigInteger("0");
		BigInteger pow27 = new BigInteger("1");
		for(int i = key.length() - 1; i >= 0; i--) {
			int letter = key.charAt(i) - 96;
			BigInteger letterB = new BigInteger(String.valueOf(letter));
			hashVal = hashVal.add(letterB.multiply(pow27));
			pow27 = pow27.multiply(new BigInteger(String.valueOf(27)));
		}
		return hashVal.mod(new BigInteger(String.valueOf(arr.length))).intValue();
	}
}

可以看到,我们是通过对要插入的数值先进行hash编码,再对数值的长度进行取模i,这样得到的位置总能够落在数值的长度内,

里面有个地方可能不太好理解,就是在插入数据的时候,我们使用while循环进行插入,既然是开发地址,也就是说数组的每一个闲置的空间我们都能使用,前提是这个位置没有被其他的值占用,由于数组是连续的,所以我们需要循环的去寻找一个这样的位置,所以才有 ++hashVal这段代码,直到找到了一个空位,然后我们把数据插入进去,

运行测试main方法,我们看到,数据成功插入,但通过hash函数计算得到的“a”和"ct"却是一样的,再一次印证了我们前面所说的问题,

以上便是所说的采用开发地址法解决hash冲突的解决方法,但这样就万无一失了吗?

我们考虑一下,数据的长度是有限的,但我们可能会往数组里面添加很多数据进去,数组总有被填满的时候,那样开发地址法也不管用了,当然,实际业务中,如果可以预料数据的大小,我们可以采用这样的方式解决部分问题,但问题是这样确实不是万无一失的解决办法,

更合适的方式是什么呢?其实就是hashMap中使用较多的链地址法,也就是一开始我们图中展示的,基本结构仍然是一个数组,但是数组的每个单元维护的不再是一个个数据,而是一个个链表,也就是类似于linkedList这样的结构,当新插入的多个数据通过计算hash函数得到的是相同的数组下标时候,我们只需要把值往这个索引位置维护的链表中插入即可,什么是链地址法呢?

**

在hash表每个单元中设置链表,某个要插入的数据项的关键字还是像通常那样映射到hash表的某个单元中,而数据项的本身则被插入到该单元维护的链表中;

**

下面用代码来实现一下这个过程,同上面所有不同的是,链表中的结构我们通过是维护者一个个节点,即Node ,对链表结构不熟悉的同学可以先自行百度一下,不是很难,

1、定义一个对象Info,

public class Info {

	private String key;
	private String name;

	public Info(String key, String name) {
		this.key = key;
		this.name = name;
	}

	public String getKey() {
		return key;
	}

	public void setKey(String key) {
		this.key = key;
	}

	public String getName() {
		return name;
	}

	public void setName(String name) {
		this.name = name;
	}

}

2、定义一个Node作为链表中的基本存储单元,

public class Node {

	// 数据域
	public Info info;
	// 指针域,指向对下一个节点引用
	public Node next;

	public Node(Info info) {
		this.info = info;
	}

}

3、定义一个链表,

/**
 * 模拟linkedList
 *
 * @author asus
 *
 */
public class LinkList {

	// 头结点
	private Node first;

	public LinkList() {
		first = null;
	}

	// 插入一个节点
	public void insertFirst(Info info) {
		Node node = new Node(info);
		node.next = first;
		first = node;
	}

	// 删除一个节点,在头结点后进行删除
	public Node deleteFirst() {
		Node temp = first;
		first = temp.next;
		return temp;
	}

	/**
	 * 查找方法
	 */
	public Node find(String key) {
		Node current = first;
		while (!key.equals(current.info.getKey())) {
			if (current.next == null) {
				return null;
			}
			current = current.next;
		}
		return current;
	}

	/**
	 * 删除方法
	 */
	public Node delete(String key) {
		Node current = first;
		Node previous = first;
		while (!key.equals(current.info.getKey())) {
			if (current.next == null) {
				return null;
			}
			previous = current;
			current = current.next;
		}

		if (current == first) {
			first = first.next;
		} else {
			previous.next = current.next;
		}
		return current;

	}

}

4、模拟hashMap的几个方法,

public class HashTable {

	private LinkList[] arr;

	/**
	 * 默认的构造方法
	 */
	public HashTable() {
		arr = new LinkList[100];
	}

	/**
	 * 指定数组初始化大小
	 */
	public HashTable(int maxSize) {
		arr = new LinkList[maxSize];
	}

	/**
	 * 插入数据
	 */
	public void insert(Info info) {
		String key = info.getKey();
		// 获取关键字的自定义hash函数
		int hashVal = hashCode(key);

		if (arr[hashVal] == null) {		//如果数组某个单元的位置为空,则需要重新构造一个linkList
			arr[hashVal] = new LinkList();
		}
		arr[hashVal].insertFirst(info);
	}

	/**
	 * 查找数据
	 */
	public Info find(String key) {
		int hashVal = hashCode(key);
		return arr[hashVal].find(key).info;
	}

	/**
	 * 删除数据
	 */
	public Info delete(String key){
		int hashVal = hashCode(key);
		return arr[hashVal].delete(key).info;
	}

	/**
	 * 自定义计算hash的函数
	 */
	public int hashCode(String key) {

		BigInteger hashVal = new BigInteger("0");
		BigInteger pow27 = new BigInteger("1");
		for (int i = key.length() - 1; i >= 0; i--) {
			int letter = key.charAt(i) - 96;
			BigInteger letterB = new BigInteger(String.valueOf(letter));
			hashVal = hashVal.add(letterB.multiply(pow27));
			pow27 = pow27.multiply(new BigInteger(String.valueOf(27)));
		}
		return hashVal.mod(new BigInteger(String.valueOf(arr.length))).intValue();
	}

}

和上面开发地址法插入数据和查找数据不同,此种方式进行数据查找的时候,其实是进行两次查到的,第一次定位数组中的位置,第二次去到链表中,调用链表的查找方法进行查找,这一点值得注意,插入和删除的思想也是类似,

下面我们来测试一下,可以看到,依然达到了效果,说明我们模拟的链地址法也生效了,

以上就是通过开发地址法和链地址法解决hash冲突的两种方式,希望对大家理解hashMap的底层原理有所帮助…感谢观看!也希望大家多多支持我们。

(0)

相关推荐

  • JAVA HashMap详细介绍和示例

    第1部分 HashMap介绍HashMap简介HashMap 是一个散列表,它存储的内容是键值对(key-value)映射.HashMap 继承于AbstractMap,实现了Map.Cloneable.java.io.Serializable接口.HashMap 的实现不是同步的,这意味着它不是线程安全的.它的key.value都可以为null.此外,HashMap中的映射不是有序的.HashMap 的实例有两个参数影响其性能:"初始容量" 和 "加载因子".容量

  • Java8 HashMap的实现原理分析

    前言:Java8之后新增挺多新东西,在网上找了些相关资料,关于HashMap在自己被血虐之后痛定思痛决定整理一下相关知识方便自己看.图和有些内容参考的这个文章:http://www.jb51.net/article/80446.htm HashMap的存储结构如图:一个桶(bucket)上的节点多于8个则存储结构是红黑树,小于8个是单向链表. 1:HashMap的一些属性 public class HashMap<k,v> extends AbstractMap<k,v> impl

  • java遍历HashMap简单的方法

    本文实例讲述了java遍历HashMap简单的方法.分享给大家供大家参考.具体实现方法如下: import java.util.HashMap; import java.util.Iterator; import java.util.Set; public class HashSetTest { public static void main(String[] args) { HashMap map = new HashMap(); map.put("a", "aa"

  • 全面解析java中的hashtable

    Hashtables提供了一个很有用的方法可以使应用程序的性能达到最佳. Hashtables(哈希表)在计算机领域中已不 是一个新概念了.它们是用来加快计算机的处理速度的,用当今的标准来处理,速度非常慢,而它们可以让你在查询许多数据条目时,很快地找到一个特殊的条目. 尽管现代的机器速度已快了几千倍,但是为了得到应用程序的最佳性能,hashtables仍然是个很有用的方法. 设想一下,你有一个包含约一千条记录的数据文件??比如一个小企业的客户记录还有一个程序,它把记录读到内存中进行处理.每个记录

  • java中Hashtable和HashMap的区别分析

    1.Hashtable是Dictionary的子类, 复制代码 代码如下: public class Hashtable<K,V>     extends Dictionary<K,V>     implements Map<K,V>, Cloneable, java.io.Serializable HashMap: 复制代码 代码如下: public class HashMap<K,V>    extends AbstractMap<K,V> 

  • Java用自定义的类作为HashMap的key值实例

    这是Java中很经典的问题,在面试中也经常被问起.其实很多书或者文章都提到过要重载hashCode()和equals()两个方法才能实现自定义键在HashMap中的查找,但是为什么要这样以及如果不这样做会产生什么后果,好像很少有文章讲到,所以写这么一篇来说明下. 首先,如果我们直接用以下的Person类作为键,存入HashMap中,会发生发生什么情况呢? public class Person { private String id; public Person(String id) { thi

  • Java中HashMap和TreeMap的区别深入理解

    首先介绍一下什么是Map.在数组中我们是通过数组下标来对其内容索引的,而在Map中我们通过对象来对对象进行索引,用来索引的对象叫做key,其对应的对象叫做value.这就是我们平时说的键值对. HashMap通过hashcode对其内容进行快速查找,而 TreeMap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用TreeMap(HashMap中元素的排列顺序是不固定的). HashMap 非线程安全 TreeMap 非线程安全 线程安全 在Java里,线程安全一般体

  • java使用hashMap缓存保存数据的方法

    本文实例讲述了java使用hashMap缓存保存数据的方法.分享给大家供大家参考,具体如下: private static final HashMap<Long, XXX> sCache = new HashMap<Long, XXX>(); private static int sId = -1; public static void initAlbumArtCache() { try { //... if (id != sId) { clearCache(); sId = id

  • Java常用HASH算法总结【经典实例】

    本文实例讲述了Java常用HASH算法.分享给大家供大家参考,具体如下: /** * Hash算法大全<br> * 推荐使用FNV1算法 * @algorithm None * @author Goodzzp 2006-11-20 * @lastEdit Goodzzp 2006-11-20 * @editDetail Create */ public class HashAlgorithms { /**//** * 加法hash * @param key 字符串 * @param prime

  • JAVA hashCode使用方法详解

    一.问题引入谈到hashCode就不得不说equals方法,二者均在Object类里,由于Object类是所有类的基类,所以一切类里都可以重写这两个方法.要想较清晰的理解,需要先知道容器Collection,Set,list,Map(key值不可重复),Set元素无序不重复,list元素有序可重复,那么JVM是如何确定不同的元素的呢?难道是逐个比较么,那样效率就太低了,JVM采用hash的方法(hash地址不一定是实际的物理地址),看看这个地址上是否有内容,没的话就认为不存在相同对象-- 且看下

  • java HashMap通过value反查key的代码示例

    复制代码 代码如下: import java.util.ArrayList;import java.util.HashMap;import java.util.Iterator;import java.util.Map;import java.util.Set;public class MapValueGetKey {  public static void main(String[] args) {    Map map = new HashMap<>();    map.put(1,&qu

随机推荐