Java List中数据的去重
list中数据的去重,通常使用将list转换为set,简单直接,因为set集合的特点就是没有重复的元素。需要考虑一下两种情况:
1.List集合中的数据类型是基本数据类型
可以直接将list集合转换成set,就会自动去除重复的元素。
如下示例:
public class Test { public static void main(String[] args) { List list = new ArrayList(); list.add(11); list.add(12); list.add(13); list.add(14); list.add(15); list.add(11); System.out.println(list); Set set = new HashSet(); List newList = new ArrayList(); set.addAll(list); newList.addAll(set); System.out.println(newList); } }
2.List集合中存储的数据类型是对象类型
需要在对象的实体类中去重写equals()方法和hashCode()方法
public class People { private String name; private String phoneNumber; public String getName() { return name; } public void setName(String name) { this.name = name; } public String getPhoneNumber() { return phoneNumber; } public void setPhoneNumber(String phoneNumber) { this.phoneNumber = phoneNumber; } public People(String name, String phoneNumber) { super(); this.name = name; this.phoneNumber = phoneNumber; } @Override public String toString() { return "People{" + "name='" + name + ''' + ", phoneNumber='" + phoneNumber + ''' + '}'; } @Override public boolean equals(Object o) { People p = (People) o; return name.equals(p.name) && phoneNumber.equals(p.phoneNumber); } @Override public int hashCode() { String str = name + phoneNumber; return str.hashCode(); } } public static void main(String[] args) { List<People> listPeople = new ArrayList<People>(); listPeople.add(new People("张三", "11111")); listPeople.add(new People("张三", "22222")); listPeople.add(new People("李四", "33333")); listPeople.add(new People("张三", "22222")); Set<People> setData = new HashSet<People>(); setData.addAll(listPeople); System.out.println("list:" + listPeople.toString()); System.out.println("set:" + setData.toString()); }
最后,我们拿出String中的equals()方法和hashCode()方法源码来加深认识:
equals()
public boolean equals(Object anObject) { if (this == anObject) { return true; } if (anObject instanceof String) { String anotherString = (String)anObject; int n = count; if (n == anotherString.count) { char v1[] = value; char v2[] = anotherString.value; int i = offset; int j = anotherString.offset; while (n-- != 0) { if (v1[i++] != v2[j++]) return false; } return true; } } return false; }
比较两个对象时,首先先去判断两个对象是否具有相同的地址,如果是同一个对象的引用,则直接放回true;如果地址不一样,则证明不是引用同一个对象,接下来就是挨个去比较两个字符串对象的内容是否一致,完全相等返回true,否则false。
hashCode()
public int hashCode() { int h = hash; if (h == 0 && count > 0) { int off = offset; char val[] = value; int len = count; for (int i = 0; i < len; i++) { h = 31*h + val[off++]; } hash = h; } return h; }
hashCode()官方定义:
hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。
hashCode 的常规协定是:
在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。
如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。
以下情况不是必需的:如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。
实际上,由 Object 类定义的 hashCode 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 JavaTM 编程语言不需要这种实现技巧。)
当equals方法被重写时,通常有必要重写 hashCode 方法,以维护 hashCode 方法的常规协定,该协定声明相等对象必须具有相等的哈希码。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对我们的支持。如果你想了解更多相关内容请查看下面相关链接