Java数据机构中关于并查集的详解

目录
  • 概念
  • 实现
    • 初始化并查集
    • 判断是不是同一个组
    • 查找当前节点的代表节点
    • 合并操作

本期文章源码:GitHub

一文彻底搞懂《并查集》!

概念

并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题(即所谓的并、查)。比如说,我们可以用并查集来判断一个森林中有几棵树、某个节点是否属于某棵树等。

具体的用法,我们会以下一篇文章《图的相关算法》中,有一个克鲁斯卡尔算法,用于生成最小生成树,会用到并查集。

并查集的主要作用是求连通分支数(如果一个图中所有点都存在可达关系(直接或间接相连),则此图的连通分支数为1;如果此图有两大子图各自全部可达,则此图的连通分支数为2……)

在现实生活中,也是存在着并查集的一些概念,例如最近《天龙八部》里的人物关系,可能你并不认识丐帮的一些小人物,但是你一定认识丐帮帮主乔峰。当你看见一个叫花子,你就会想到他的老大就是帮主乔峰,像这样的场景,就有了一定的归属感, 会自动的认为叫花子就是跟丐帮合并在一起的……

说简单一点,并查集就是将一些数据进行分类,这样数据为一组,那些数据为另一组。如何判断其中两个数据,在不在一个组?我们就会去找每个组的代表,看这两个数据的代表是不是同一个?如果是,那就是在一个组;如果不是,那就不在一个组。所以并查集的大致框架就是下面这样:

//并查集大致框架---代码中的数据(Node),可以是其他,比如二叉树节点、图的边、节点等等 抽象的数据
public class UnionSet {
    private HashMap<Node, Node> fatherMap; //key表示当前这个数据,value表示这个数据的代表(父亲)是谁
    private HashMap<Node, Integer> sizeMap; //表示当前这个组(集合)的大小

    public UnionSet() { //构造方法
        fatherMap = new HashMap<>();
        sizeMap = new HashMap<>();
    }

    public void makeSet(List<Node> list) { //生成初始化状态的并查集,刚开始每个数据都是独立的

    }

    public boolean isSameSet(Node node1, Node node2) { //判断当前这两个数据,是不是一个组的?

    }

    private Node findFather(Node node) { //查找这个数据,它那个组的代表(父亲)是谁?

    }

    public void union(Node node1, Node node2) { //将这两个数据,放到一个组

    }
}

上面就是大致的框架,就是几个方法:初始化并查集、判断是不是一个组、查找代表、合并到一个组。四个方法,就是并查集。简不简单?

并查集在判断两个数据,是否在一个组时,时间复杂度能做到O(1),所以这种数据结构还是非常有用的。

实现

初始化并查集

我们首先从第一个方法:初始化并查集开始。

传入进去的参数不一定是List,也可以是Collection等等,表示一组数据即可! 首先我们的成员变量只有两个,分别是存储节点的代表 和 当前这个组的大小。初始化时,我们分别认为 每个节点是自己一个人一组的,也就是说,自己一个组,代表就是自己本身;大小的话,就是自己本身咯,也就是1。

//初始化并查集
public void makeSet(List<Node> list) {
    if (list == null) {
        return;
    }
    fatherMap.clear();
    sizeMap.clear(); //先将表清空

    //遍历list,把每一个节点,都放入哈希表中
    for (Node node : list) {
        fatherMap.put(node, node); //第一个参数是节点本身,第二个参数就是这个组的代表
        sizeMap.put(node, 1); //第一个参数是这个组的代表,第二个参数是大小
    }
}

判断是不是同一个组

isSameSet 比较简单,就是判断两个数据所在的组的代表,是不是用一个数据即可!如果代表是同一个人,那就是在一个组,反之就不是!

//判断是不是同一个组
public boolean isSameSet(Node node1, Node node2) {
    if (node1 == null || node2 == null) {
        return false;
    }
    return findFather(node1) == findFather(node2); //查找各自的代表节点,看是不是同一个。
}

查找当前节点的代表节点

findFather,我自己觉得算是并查集的核心,也这是这个方法,是并查集的查找的时间复杂度能在O(1)的主要因素。

思路就跟二叉树向上查找根结点的思路一样,也就是说,在fatherMap中一直查找,直到一个节点的代表节点(父节点)是它自己本身时,此时就查找完了;然后最关键的一步,就是路径压缩,在我们向上查找的过程中,我们需要记录沿途的所有节点,在查找结束后,我们将沿途的这些节点,在fatherMap中的进行修改,直接将这些节点的代表节点,写成这个组的代表节点,可能听糊涂了,看下图:

这样的设计,就能使查找的时间复杂度控制在O(1)。

//查找代表节点,并做路径压缩
private Node findFather(Node node) {
    if (node == null) {
        return null;
    }
    //查找代表节点
    Stack<Node> path = new Stack<>(); //存储沿途的节点
    while (node != fatherMap.get(node)) { //代表节点不是自己本身,就继续查找
        path.push(node);
        node = fatherMap.get(node);
    }
    //路径压缩
    while (!path.isEmpty()) {
        Node tmp = path.pop();
        fatherMap.put(tmp, node); //此时的node,就是这个组的代表节点
    }

    return node;
}

合并操作

终于来到了最后的操作:合并。合并也比较简单,记住一个要点:小组挂在大组的下面。也就是说,这一个节点所在的组要小一点,我们直接将他“挂”在另一个组的下面。说简单一点:这一个组的代表节点的vaule域,直接指向另一个组的代表节点。

//合并操作
public void union(Node node1, Node node2) {
    if (node1 == null || node2 == null) {
        return;
    }
    int node1Size = sizeMap.get(node1);
    int node2Size = sizeMap.get(node2); //分别得到两个节点所在组的大小
    Node node1Father = fatherMap.get(node1);
    Node node2Father = fatherMap.get(node2); //分别拿到两个节点的代表节点

    if (node1Father != node2Father) { //两个节点,不在同一个组,就合并
        if (node1Size < node2Size) { //node1 挂在 node2
            fatherMap.put(node1Father, node2Father);
            sizeMap.put(node2Father, node1Size + node2Size); //新的组,大小是原来两个组的和
            sizeMap.remove(node1Father); //小组的数据,就不需要了,删除
        } else { //node2 挂在 node1
            //跟上面操作类似
            fatherMap.put(node2Father, node1Father);
            sizeMap.put(node1Father, node1Size + node2Size);
            sizeMap.remove(node1Father);
        }
    }
}

上面就是并查集的所有操作了,是不是很简单呢?

好啦,本期更新到此就结束啦,同学们,下期见!!!

到此这篇关于Java数据机构中关于并查集的详解的文章就介绍到这了,更多相关Java 数据机构 并查集内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Java实现快速并查集

    在一些应用的问题中,需将n个不同的元素划分成一组不相交的集合.开始时,每个元素自成一格单元素集合,然后按一定顺序将属于同一组的元素的集合合并.其间要反复用到查询某个元素属于哪个集合的运算.适合于描述这类问题的抽象数据类型称为并查集. 1. 并查集的概述 并查集的数学模型是一组不相交的动态集合的集合S={A,B,C,...},它支持以下的运算: (1)union(A,B):将集合A和B合并,其结果取名为A或B: (2)find(x):找出包含元素x的集合,并返回该集合的名字. 在并查集中需要两个类

  • Java实现并查集

    本文实例为大家分享了Java实现并查集的具体代码,供大家参考,具体内容如下 自下而上的树结构 接口 /** * @author Nino */ public interface UF { int size(); /** * 看两个元素是否相连 * @param p * @param q * @return */ boolean isConnected(int p, int q); /** * 将两个元素合并在一起,变成一个集合中的元素 * @param p * @param q */ void

  • 详解Java实现数据结构之并查集

    ​一.什么是并查集 对于一种数据结构,肯定是有自己的应用场景和特性,那么并查集是处理什么问题的呢? 并查集是一种树型的数据结构,用于处理一些不相交集合(disjoint sets)的合并及查询问题,常常在使用中以森林来表示.在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中.其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受:即使在空

  • Java使用HashMap实现并查集

    并查集的定义: 并查集,在一些有N个元素的集合应用问题中,我们通常是在开始时让每个元素构成一个单元素的集合,然后按一定顺序将属于同一组的元素所在的集合合并,其间要反复查找一个元素在哪个集合中.这一类问题近几年来反复出现在信息学的国际国内赛题中,其特点是看似并不复杂,但数据量极大,若用正常的数据结构来描述的话,往往在空间上过大,计算机无法承受;即使在空间上勉强通过,运行的时间复杂度也极高,根本就不可能在比赛规定的运行时间(1~3秒)内计算出试题需要的结果,只能用并查集来描述. 并查集是一种树型的数

  • Java数据机构中关于并查集的详解

    目录 概念 实现 初始化并查集 判断是不是同一个组 查找当前节点的代表节点 合并操作 本期文章源码:GitHub 一文彻底搞懂<并查集>! 概念 并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题(即所谓的并.查).比如说,我们可以用并查集来判断一个森林中有几棵树.某个节点是否属于某棵树等. 具体的用法,我们会以下一篇文章<图的相关算法>中,有一个克鲁斯卡尔算法,用于生成最小生成树,会用到并查集. 并查集的主要作用是求连通分支数(如果一个图中所有点都存在可达关系(直

  • Java实现并查集示例详解

    目录 题目 思路 find实现 join的实现 整体代码  题目 题目背景 若某个家族人员过于庞大,要判断两个是否是亲戚,确实还很不容易,现在给出某个亲戚关系图,求任意给出的两个人是否具有亲戚关系. 思路 对于该题而言,考察的是并查集,也就是小怪兽逐个找上级领导的思路,指导找到最终的Boss停止下来,如果两个怪兽要打架,需要问一问他们的上级领导,领导再问领导,逐级向上,最终发现它们属于同一个Boss的部署的话就不能再打架了,这道题同样的思路,如果斗罗大陆的一开始白沉香不知道唐三是亲戚的话,他们就

  • java 正则,object中两个方法的使用(详解)

    正则: "."和"\" "."点儿,在正则表达式中表示任意一个字符. "\"在正则表达式中是转意字符,当我们需要描述一个已经被正则表达式使用的特殊字符时,我们就可以通过使用"\"将其转变为原本的意思. "\"在正则表达式中也有一些预定义的特殊内容: \d:表示任意一个数字 \w:表示任意一个单词字符(只能是 数字,字母,下划线) \s:表示任意一个空白字符(\t \r \n \f \x0

  • Java 判断字符串中是否包含中文的实例详解

    Java 判断字符串中是否包含中文的实例详解 Java判断一个字符串是否有中文是利用Unicode编码来判断,因为中文的编码区间为:0x4e00--0x9fbb, 不过通用区间来判断中文也不非常精确,因为有些中文的标点符号利用区间判断会得到错误的结果.而且利用区间判断中文效率也并不高,例如:str.substring(i, i + 1).matches("[\\一-\\?]+"),就需要遍历整个字符串,如果字符串太长效率非常低,而且判断标点还会错误.这里提高 一个高效准确的判断方法,使

  • Java面向对象编程中final关键字的使用方法详解

    在Java中通过final关键字来声明对象具有不变性(immutable),这里的对象包括变量,方法,类,与C++中的const关键字效果类似. immutable指对象在创建之后,状态无法被改变 可以从三个角度考虑使用final关键字: 代码本身:不希望final描述的对象所表现的含义被改变 安全:final对象具有只读属性,是线程安全的 效率:无法修改final对象本身,对其引用的操作更为高效 final 变量 定义final Object a,则a只能被初始化一次,一旦初始化,a的数据无法

  • Java程序开发中abstract 和 interface的区别详解

    先给大家说下基本概念 在Java语言中, abstract class 和interface 是支持抽象类定义的两种机制.正是由于这两种机制的存在,才赋予了Java强大的 面向对象能力.abstract class和interface之间在对于抽象类定义的支持方面具有很大的相似性,甚至可以相互替换,因此很多开发者在进 行抽象类定义时对于abstract class和interface的选择显得比较随意.其实,两者之间还是有很大的区别的,对于它们的选择甚至反映出对 于问题领域本质的理解.对于设计意

  • Java程序开发中abstract 和 interface的区别详解

    先给大家说下基本概念 在Java语言中, abstract class 和interface 是支持抽象类定义的两种机制.正是由于这两种机制的存在,才赋予了Java强大的 面向对象能力.abstract class和interface之间在对于抽象类定义的支持方面具有很大的相似性,甚至可以相互替换,因此很多开发者在进 行抽象类定义时对于abstract class和interface的选择显得比较随意.其实,两者之间还是有很大的区别的,对于它们的选择甚至反映出对 于问题领域本质的理解.对于设计意

  • Java线程编程中isAlive()和join()的使用详解

    一个线程如何知道另一线程已经结束?Thread类提供了回答此问题的方法. 有两种方法可以判定一个线程是否结束.第一,可以在线程中调用isAlive().这种方法由Thread定义,它的通常形式如下: final boolean isAlive( ) 如果所调用线程仍在运行,isAlive()方法返回true,如果不是则返回false.但isAlive()很少用到,等待线程结束的更常用的方法是调用join(),描述如下: final void join( ) throws InterruptedE

  • Java中SSM框架实现增删改查功能代码详解

    记录一下自己第一次整合smm框架的步骤. 参考博客和网站有:我没有三颗心脏 How2J学习网站 1.数据库使用的是mySql,首先创建数据库ssm1,并创建表student create database ssm1; use ssm1; CREATE TABLE student( id int(11) NOT NULL AUTO_INCREMENT, student_id int(11) NOT NULL UNIQUE, name varchar(255) NOT NULL, age int(1

  • mybatis实现对数据的增删查改实例详解

    前期准备 新建java工程或java wweb工程,需要导入以下的包, 基本工作已经完成,接下来开始进入正题. 新建实体类 新建与数据库表对应的实体类 package com.edu.hpu.domain; /** * @author Administrator *user表所对应的实体类 */ public class User { //实体类的属性和表的字段名称一一对应 private int id; private String name; private int age; //对属性进行

随机推荐