java暴力匹配及KMP算法解决字符串匹配问题示例详解

2025-02-25 01:11:29

要解决的问题？

一、暴力匹配算法

一个图例介绍KMP算法

String str1 = "BBC ABCDAB ABCDABCDABDE";
String str2 = "ABCDABD";

1. S[0]为B，P[0]为A，不匹配，执行第②条指令：“如果失配（即S[i]! = P[j]），令i = i - (j - 1)，j = 0”，S[1]跟P[0]匹配，相当于模式串要往右移动一位（i=1，j=0）

2. S[1]跟P[0]还是不匹配，继续执行第②条指令：“如果失配（即S[i]! = P[j]），令i = i - (j - 1)，j = 0”，S[2]跟P[0]匹配（i=2，j=0），从而模式串不断的向右移动一位（不断的执行“令i = i - (j - 1)，j = 0”，i从2变到4，j一直为0）

3. 直到S[4]跟P[0]匹配成功（i=4，j=0），此时按照上面的暴力匹配算法的思路，转而执行第①条指令：“如果当前字符匹配成功（即S[i] == P[j]），则i++，j++”，可得S[i]为S[5]，P[j]为P[1]，即接下来S[5]跟P[1]匹配（i=5，j=1)

4. S[5]跟P[1]匹配成功，继续执行第①条指令：“如果当前字符匹配成功（即S[i] == P[j]），则i++，j++”，得到S[6]跟P[2]匹配（i=6，j=2），如此进行下去

5. 直到S[10]为空格字符，P[6]为字符D（i=10，j=6），因为不匹配，重新执行第②条指令：“如果失配（即S[i]! = P[j]），令i = i - (j - 1)，j = 0”，相当于S[5]跟P[0]匹配（i=5，j=0）

6. 至此，我们可以看到，如果按照暴力匹配算法的思路，尽管之前文本串和模式串已经分别匹配到了S[9]、P[5]，但因为S[10]跟P[6]不匹配，所以文本串回溯到S[5]，模式串回溯到P[0]，从而让S[5]跟P[0]匹配。

而S[5]肯定跟P[0]失配。为什么呢？因为在之前第4步匹配中，我们已经得知S[5] = P[1] = B，而P[0] = A，即P[1] != P[0]，故S[5]必定不等于P[0]，所以回溯过去必然会导致失配。那有没有一种算法，让i 不往回退，只需要移动j 即可呢？

答案是肯定的。这种算法就是KMP算法，它利用之前已经部分匹配这个有效信息，保持i 不回溯，通过修改j 的位置，让模式串尽量地移动到有效的位置。

public class ViolenceMatch {
	public static void main(String[] args) {
		String str1 = "硅硅谷 尚硅谷你尚硅 尚硅谷你尚硅谷你尚硅你好";
		String str2 = "尚硅谷你尚硅你";
		int index = violenceMatch(str1, str2);
		System.out.println("index=" + index);
	}
	/**
	 * 暴力匹配算法
	 */
	public static int violenceMatch(String str1, String str2) {
		char[] s1 = str1.toCharArray();
		char[] s2 = str2.toCharArray();

		int s1Len = s1.length;
		int s2Len = s2.length;

		int i = 0;// i索引指向s1
		int j = 0;// j索引指向s2
		while (i < s1Len && j < s2Len) {// 保证匹配时，不越界
			if (s1[i] == s2[j]) {// 匹配ok
				i++;
				j++;
			} else {// 没有匹配成功
					// 如果不匹配(即str1[i] != str2[j],令i = i - (j - 1),j = 0)
				i = i - (j - 1);
				j = 0;
			}
		}
		// 判断是否匹配成功
		if (j == s2Len) {
			return i - j;
		} else {
			return -1;
		}
	}
}

暴力匹配算法的缺点：大量数据使用暴力匹配效率很低

二、KMP算法

关于KMP算法的学习，参考了这篇文章，此博主写的特别详细，大佬！

很详尽KMP算法（厉害） - ZzUuOo666 - 博客园

算法介绍

KMP的主要思想是：1. 先得到子串的部分匹配表 2.使用部分匹配表完成KMP匹配

一个图例介绍KMP算法

代码实现

public class KMPAlgorithm {
	public static void main(String[] args) {
		String str1 = "BBC ABCDAB ABCDABCDABDE";
		String str2 = "ABCDABD";
		int[] next = kmpNext("ABCDABD");
		System.out.println("next=" + Arrays.toString(next));
 		int index = kmpSearch(str1, str2, next);
		System.out.println("index=" + index);
	}
	/**
	 * kmp搜索算法
	 *
	 * @param str1 原字符串
	 * @param str2 子串
	 * @param next 部分匹配表，是子串对应的部分匹配表
	 * @return 如果是-1就是没有匹配到，否则返回第一个匹配的位置
	 */
	public static int kmpSearch(String str1, String str2, int[] next) {
		// 遍历
		for (int i = 0, j = 0; i < str1.length(); i++) {

			// 需要处理 str1.charAt(i) != str2.charAt(j),去调整j的大小
			// KMP算法核心点
			while (j > 0 && str1.charAt(i) != str2.charAt(j)) {
				j = next[j - 1];
			}
			if (str1.charAt(i) == str2.charAt(j)) {
				j++;
			}
			if (j == str2.length()) {// 找到了
				return i - j + 1;
			}
		}
		return -1;
	}
	/**
	 * 获取到一个字符串(子串)的部分匹配值表
	 */
	public static int[] kmpNext(String dest) {
		// 创建一个next数组保存部分匹配值
		int[] next = new int[dest.length()];
		next[0] = 0;// 如果字符串是长度为1部分匹配值就是0
		for (int i = 1, j = 0; i < dest.length(); i++) {
			// 当dest.charAt(i) != dest.charAt(j)，需要从next[j - 1]获取新的j
			// 直到发现有dest.charAt(i) == dest.charAt(j)成立才退出
			// 这是kmp算法核心点
			while (j > 0 && dest.charAt(i) != dest.charAt(j)) {
				j = next[j - 1];
			}
			if (dest.charAt(i) == dest.charAt(j)) {
				j++;
			}
			next[i] = j;
		}
		return next;
	}
}

以上就是java暴力匹配及KMP算法解决字符串匹配问题示例详解的详细内容，更多关于暴力匹配及KMP算法解决字符串匹配的资料请关注我们其它相关文章！

Java数据结构彻底理解关于KMP算法

大家好,前面的有一篇文章讲了子序列和全排列问题,今天我们再来看一个比较有难度的问题.那就是大名鼎鼎的KMP算法. 本期文章源码:GitHub源码简介 KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt提出的,因此人们称它为克努特-莫里斯-普拉特操作(简称KMP算法).KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的.具体实现就是通过一个next()函数实现,函数本身包含了模式串的局部匹配信息.KMP算法
二叉树递归迭代及morris层序前中后序遍历详解

目录分析二叉树的前序,中序,后序的遍历步骤 1.层序遍历方法一:广度优先搜索方法二:递归 2.前序遍历 3.中序遍历 4.后序遍历递归解法前序遍历--递归迭代解法前序遍历--迭代核心思想: 三种迭代解法的总结: Morris遍历 morris--前序遍历 morris--中序遍历 morris--后序遍历: 分析二叉树的前序,中序,后序的遍历步骤 1.层序遍历方法一:广度优先搜索 (以下解释来自leetcode官方题解) 我们可以用广度优先搜索解决这个问题. 我们可以想到最
java数据结构图论霍夫曼树及其编码示例详解

目录霍夫曼树一.基本介绍二.霍夫曼树几个重要概念和举例说明构成霍夫曼树的步骤霍夫曼编码一.基本介绍二.原理剖析注意: 霍夫曼编码压缩文件注意事项霍夫曼树一.基本介绍二.霍夫曼树几个重要概念和举例说明构成霍夫曼树的步骤举例:以arr = {1 3 6 7 8 13 29} public class HuffmanTree { public static void main(String[] args) { int[] arr = { 13, 7, 8
java贪心算法初学感悟图解及示例分享

算法简介 1)贪心算法是指在对问题进行求解时,在每一步选择中都采取最好或者最优(即最有利)的选择,从而希望能够导致是最好或者最优的算法 2)贪心算法所得到的结果不一定是最优的结果(有时候会是最优解),但是都是相对近似(接近)最优解的结果. 应用场景 --> 集合覆盖 public class GreedyAlgorithm { public static void main(String[] args) { // 创建广播电台,放入到Map HashMap<String, HashSet<
java图论普利姆及克鲁斯卡算法解决最小生成树问题详解

目录什么是最小生成树? 普利姆算法算法介绍应用 --> 修路问题图解分析克鲁斯卡尔算法算法介绍应用场景 -- 公交站问题算法图解算法分析如何判断是否构成回路什么是最小生成树? 最小生成树(Minimum Cost Spanning Tree),简称MST. 最小生成树要求图是连通图.连通图指图中任意两个顶点都有路径相通,通常指无向图.理论上如果图是有向.多重边的,也能求最小生成树,只是不太常见. 普利姆算法算法介绍应用 --> 修路问题图解分析
java图论弗洛伊德和迪杰斯特拉算法解决最短路径问题

目录弗洛伊德算法算法介绍算法图解分析迪杰斯特拉算法算法介绍算法过程弗洛伊德算法算法介绍算法图解分析第一轮循环中,以A(下标为:0)作为中间顶点 [即把作为中间顶点的所有情况都进行遍历,就会得到更新距离表和前驱关系],距离表和前驱关系更新为: 弗洛伊德算法和迪杰斯特拉算法的最大区别是: 弗洛伊德算法是从各个顶点出发,求最短路径: 迪杰斯特拉算法是从某个顶点开始,求最短路径. /** * 弗洛伊德算法 * 容易理解,容易实现 */ public void floyd
java 中模式匹配算法-KMP算法实例详解

java 中模式匹配算法-KMP算法实例详解朴素模式匹配算法的最大问题就是太低效了.于是三位前辈发表了一种KMP算法,其中三个字母分别是这三个人名的首字母大写. 简单的说,KMP算法的对于主串的当前位置不回溯.也就是说,如果主串某次比较时,当前下标为i,i之前的字符和子串对应的字符匹配,那么不要再像朴素算法那样将主串的下标回溯,比如主串为"abcababcabcabcabcabc",子串为"abcabx".第一次匹配的时候,主串1,2,3,4,5字符都和子串相应的
java暴力匹配及KMP算法解决字符串匹配问题示例详解

目录要解决的问题? 一.暴力匹配算法一个图例介绍KMP算法二.KMP算法算法介绍一个图例介绍KMP算法代码实现要解决的问题? 一.暴力匹配算法一个图例介绍KMP算法 String str1 = "BBC ABCDAB ABCDABCDABDE"; String str2 = "ABCDABD"; 1. S[0]为B,P[0]为A,不匹配,执行第②条指令:"如果失配(即S[i]! = P[j]),令i = i - (j - 1),
Java使用贪心算法解决电台覆盖问题(示例详解)

java使用贪心算法解决电台覆盖问题代码实现 /** * 贪心算法实现集合覆盖 */ public class Demo { public static void main(String[] args) { // 创建电台和地区集合 HashMap<String, HashSet<String>> broadcasts = new HashMap<>(); // 创建各个电台 HashSet<String> k1 = new HashSet<>
Go Java 算法之迷你语法分析器示例详解

目录迷你语法分析器方法一:深度优先遍历(Java) 方法二:栈(Go) 迷你语法分析器给定一个字符串 s 表示一个整数嵌套列表,实现一个解析它的语法分析器并返回解析的结果 NestedInteger . 列表中的每个元素只可能是整数或整数嵌套列表示例 1: 输入:s = "324", 输出:324 解释:你应该返回一个 NestedInteger 对象,其中只包含整数值 324. 示例 2: 输入:s = "[123,[456,[789]]]", 输出:[1
Go Java算法最大单词长度乘积示例详解

目录最大单词长度乘积方法一:位运算(java) 方法一:位运算(go) 最大单词长度乘积给你一个字符串数组 words ,找出并返回 length(words[i]) * length(words[j]) 的最大值,并且这两个单词不含有公共字母.如果不存在这样的两个单词,返回 0 . *示例 1: 输入:words = ["abcw","baz","foo","bar","xtfn","ab
后端算法题解LeetCode前缀和示例详解

目录面试题 01.09. 字符串轮转方法一:模拟思路题解方法二:搜索子字符串思路题解 1480. 一维数组的动态和方法一:前缀和思路题解 724. 寻找数组的中心下标方法一:前缀和思路解题面试题 01.09. 字符串轮转面试题 01.09. 字符串轮转难度:easy 字符串轮转.给定两个字符串 s1 和 s2,请编写代码检查 s2 是否为 s1 旋转而成(比如,waterbottle 是 erbottlewat 旋转后的字符串). 示例1: 输入:s1 = "wa
C语言编程C++旋转字符操作串示例详解

目录旋转字符串字符串左旋题前认知: 暴力移位: 三步翻转: 判断字符串旋转题前认知字符串追加判断旋转字符串字符串左旋实现一个函数,可以左旋字符串中的k个字符. 例如: ABCD左旋一个字符得到BCDA ABCD左旋两个字符得到CDAB 题前认知: 一个字符串如果就定死了.eg:char arr[]="dfdf"什么的那多没意思,一点都没有人机交互的感觉,(虽然现在人机交互适合个体,不适合集群,但也是比死板的定死字符串舒服) 所以字符串得是我们可输入的,才有可玩性,玩的不
Java实现BP神经网络MNIST手写数字识别的示例详解

目录一.神经网络的构建二.系统架构服务器客户端采用MVC架构一.神经网络的构建 (1):构建神经网络层次结构由训练集数据可知,手写输入的数据维数为784维,而对应的输出结果为分别为0-9的10个数字,所以根据训练集的数据可知,在构建的神经网络的输入层的神经元的节点个数为784个,而对应的输出层的神经元个数为10个.隐层可选择单层或多层. (2):确定隐层中的神经元的个数因为对于隐层的神经元个数的确定目前还没有什么比较完美的解决方案,所以对此经过自己查阅书籍和上网查阅资料,有以下的
C/C++语言八大排序算法之桶排序全过程示例详解

基本思路是将所有数的个位十位百位一直到最大数的最高位一步步装桶,先个位装桶然后出桶,直到最高位入桶出桶完毕. 首先我们要求出一个数组的最大数然后求出他的最大位数 //求最大位数的函数 int getmaxweisu(int* a,int len)// { int max = a[0]; for (int i = 0; i < len; i++) { if (max < a[i]) { max = a[i]; } } int count = 1; while (max/10) { count++
java 常规轮询长轮询Long polling实现示例详解

目录正文常规轮询长轮询正文长轮询是与服务器保持持久连接的最简单的方式,它不使用任何特定的协议,例如 WebSocket 或者 Server Sent Event. 它很容易实现,在很多场景下也很好用. 常规轮询从服务器获取新信息的最简单的方式是定期轮询.也就是说,定期向服务器发出请求:“你好,我在这儿,你有关于我的任何信息吗?”例如,每 10 秒一次. 作为响应,服务器首先通知自己,客户端处于在线状态,然后 —— 发送目前为止的消息包. 这可行,但是也有些缺点: 消息传递的延迟最多为
Java应用服务器之tomcat会话复制集群配置的示例详解

会话是识别用户,跟踪用户访问行为的一个手段,通过cookie(存在客户端)或session(存在服务端)来判断本次请求是那个客户端发送过来:常用的会话保持有绑定会话,就是前边我们聊的在代理上通过算法或通过给客户端响应首部加cookie这种方式来保持同一cookie或同一ip地址的请求始终发送到同一后端server进行响应:但是这样的会话绑定的方式存在一个问题,就是当后端某一server宕机,那么之前上面的所有会话信息将消失,那么后续的客户端来请求,代理是否要把请求调度到后端宕机的server呢?