java正则表达式之Pattern与Matcher类详解

Pattern.split方法详解

/**
 * 测试Pattern.split方法
 */
 @Test
 public void testPatternSplit() {

 String str = "{0x40, 0x11, 0x00, 0x00}";
 // 分割符为:逗号, {,}, 空白符
 String regex = "[,\\{\\}\\s]";
 Pattern pattern = Pattern.compile(regex);

 /*
 * 1. split 方法用于使用正则表达式中的字符分割待匹配的字符串
 *
 * 注意:
 * 1. 如果分割符位于原字符串的起始位置,则分割的时候,会在起始位置上分割出一个""出来
 * 2. 如果有连续两个分隔符,则会在这两个分割符之间分割有一个""出来
 * */
 System.out.println("----------- split test -----------");
 String[] results = pattern.split(str);

 System.out.println("length :" + results.length);
 for (int i = 0; i < results.length; i++) {
  System.out.println("element_" +i + " :" + results[i]);
 }

 System.out.println(Arrays.toString(results));

 /*
 * 2. split方法的limit参数的意思是使用正则表达式的分割字符将原字符串分为limit个组
 * **/
 System.out.println("\n----------- split limit test -----------");
 String[] resultsLimit = pattern.split(str, 2);
 for (int i = 0; i < resultsLimit.length; i++) {
  System.out.print(resultsLimit[i]);
 }
 }

结果:

----------- split test -----------
element_0 :
element_1 :0x40
element_2 :
element_3 :0x11
element_4 :
element_5 :0x00
element_6 :
element_7 :0x00
[, 0x40, , 0x11, , 0x00, , 0x00]

----------- split limit test -----------
0x40, 0x11, 0x00, 0x00}

Matcher的find/find/start/end方法详解

  • 测试Matcher的find方法:尝试在目标字符串中查找下一个匹配的字串,需在循环中迭代。
  • groupCount :返回当前查找所获得的匹配组的数量,不包括整个整个正则表达式的匹配。
    比如,表达式有两个子分组,则groupCount == 2
  • group(i):指的是用()包含的子分组,按照定义的顺序标识下标,当正则表达式中使用 |连接分组,那么有的分组匹配的字串可能为null。
  • start(group):返回此子分组匹配的子串在原字符串中的起始位置(包含)
    end(group):返回此子分组匹配的子串在原字符串中的结束位置(不包含)
    即子分组匹配的字符串在原字符串的位置为 [start(i),end(i)),左闭右开。
 @Test
 public void testMatcherGroupFindStartEnd() {
 String str = "{0x40, 0x31, 0x20, 0x00}";
 String regex = "([A-Za-z0-9]+)(,)";
 Pattern pattern = Pattern.compile(regex);

 Matcher matcher = pattern.matcher(str);

 // 对于在整个原字符串中,找到的下一个匹配的字串
 while (matcher.find()) {
  // 输出groupCount的数量
  System.out.println("groupCount : " + matcher.groupCount());

  // 0-输出整个匹配
  System.out.println("the substring of contains all group : " + matcher.group(0));
  System.out.println("group_0 start index : " + matcher.start(0) + " end :" + matcher.end(0));

  // 依次输出子分组的匹配结果
  // 如果子分组之间是通过 | 来连接的,则子分组的匹配结果有的为null
  for (int i = 1; i <= matcher.groupCount(); i++) {
  System.out.println("group_" + i + ":" + matcher.group(i));
  System.out.println("group_" + i + " start index : " + matcher.start(i) + " end :" + matcher.end(i));
  }
 }
 }

结果:

groupCount : 2
the substring of contains all group : 0x40,
group_0 start index : 1 end :6
group_1:0x40
group_1 start index : 1 end :5
group_2:,
group_2 start index : 5 end :6
groupCount : 2
the substring of contains all group : 0x31,
group_0 start index : 7 end :12
group_1:0x31
group_1 start index : 7 end :11
group_2:,
group_2 start index : 11 end :12
groupCount : 2
the substring of contains all group : 0x20,
group_0 start index : 13 end :18
group_1:0x20
group_1 start index : 13 end :17
group_2:,
group_2 start index : 17 end :18

Matcher的replace/append方法详解

测试Matcher的匹配替换以及追加的方法:

  1. matcher.replaceAll方法 :替换在原字符串中所有被正则表达式匹配的字串,并返回替换之后的结果
  2. matcher.replaceFirst方法 :替换在原字符串中第一个被正则表达式匹配的字串,并返回替换之后的结果
  3. matcher.appendReplacement方法 : 将当前匹配子串替换为指定字符串,并且将替换后的子串以及其之前到上次匹配子串之后的字符串段添加到一个StringBuffer对象里(需while(matcher.find())进行配合迭代)
  4. matcher.appendTail(StringBuffer sb) 方法则将最后一次匹配工作后剩余的字符串添加到一个StringBuffer对象里。

3和4的结合能够实现将原字符串中的某些字串替换指定字符,并返回完成替换之后的结果

@Test
 public void testMatcherReplaceAppend() {
 String str = "{0x40, 0x31, 0x20, 0x00}";
 String regex = "([0-9A-Za-z]+)";
 Pattern pattern = Pattern.compile(regex);

 Matcher matcher = pattern.matcher(str);

 // replaceAll
 System.out.println("----------- replace all test ----------");
 String replacedAllStr = matcher.replaceAll("replace");
 System.out.println("replaced : " + replacedAllStr);
 //matcher.reset(str); // 重置被matcher的字符串
 matcher.reset(); // 重置matcher,以实现对原字符串重新搜索

 // replaceFirst
 System.out.println("------------ replace first test ---------");
 String replacedFirstStr = matcher.replaceFirst("replace");
 System.out.println("replaced first : " + replacedFirstStr);
 matcher.reset();

 // appendReplacement
 System.out.println("------------- appendReplacement test ------------");
 StringBuffer appendRepStr = new StringBuffer();
 while (matcher.find()) {
  matcher.appendReplacement(appendRepStr,"0xffff");
 }
 System.out.println(appendRepStr);

 // 最后调用appendTail将匹配剩余的字符串添加都StringBuffer的末尾
 // 注意这时要实现完整的功能:将所有匹配的内容替换并添加到appendRepStr中,剩余未匹配的继续添加到
 // appendRepStr中,相当于对原字符串进行全部的替换
 // 此时要保证,在遍历所有匹配的字串后调用appendTail方法

 System.out.println("------------ appendTail test ---------------");
 matcher.appendTail(appendRepStr);

 System.out.println(appendRepStr);
 }

结果:

----------- replace all test ----------
replaced : {replace, replace, replace, replace}
------------ replace first test ---------
replaced first : {replace, 0x31, 0x20, 0x00}
------------- appendReplacement test ------------
{0xffff, 0xffff, 0xffff, 0xffff
------------ appendTail test ---------------
{0xffff, 0xffff, 0xffff, 0xffff}

测试文件源码地址

https://github.com/zhanglbjames/exercises/blob/master/src/test/java/huawei_8_16/TestT1.java

1-匹配字符类

方括号一次只能匹配括号内的一个字符

[abc]

a, b, or c (简单类)

[^abc]

除了a、b或c之外的任意 字符(求反)

[a-zA-Z]

a到z或A到Z ,包含(范围)

[a-zA-Z0-9]

匹配一次所有数字和字母的类型

[a-b-r]

匹配 a-b ,连接符 -,r
注意如果想要连接符起到范围的作用,应该满足如下格式[a-bc-de-gf-k]
即每个连接符占用的字符不能被其他连接符占用

圆括号一次匹配多个字符

  • 比如方括号的正则表达式"t[aeio]n"只匹配"tan"、"Ten"、"tin"和"ton",只能匹配单个字符,不能匹配"taeion"
  • 圆括号可以一次匹配多个字符,比如使用"t(a|e|i|o|oo)n"正则表达式,可以匹配"taen","tan","taeiooon"等
    也可以配合[]使用,如正则为"t([aei]|o|oo)n",则可以匹配 "taon","teoon",但是不能匹配"taeioon"

2-预定义字符类

. 匹配除换行符 \n 之外的任何单字符

比如:表达式就是“t.n”,它匹配“tan”、“ten”、“tin”和“ton”,还匹配“t#n”、“tpn”甚至“t n”。

  • \d 数字: [0-9]
  • \D 非数字: [^0-9]
  • \s 空格符: [ \t\n\x0B\f\r]
  • \S 非空格符: [^\s]
  • \w 单词字符: [a-zA-Z_0-9]
  • \W 非单词字符: [^\w]

记忆规则 大写表示取反,小写如下记忆

d:digit(数字)
s:space(空白字符)
w:word(单词字符), 注意包括下划线

3-表达式匹配次数

* 0次或者多次(允许0次的贪婪匹配)

例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}

+ 1次或者多次(贪婪匹配)

例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。

? 0次或者1次 (非贪婪匹配,允许0次)

例如,"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1}。

{n} 恰好n次

{n,m} 从n次到m次

{n,} 至少n次

注意上述n为非负数

4-特殊字符需要转义

总结

到此这篇关于java正则表达式之Pattern与Matcher类的文章就介绍到这了,更多相关java正则表达式Pattern与Matcher类内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • JAVA正则表达式 Pattern和Matcher

    1.简介: java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式. Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查. 首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式,然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行字

  • 详解Java正则表达式中Pattern类和Matcher类

    前言 本文将介绍Java正则表达式中的Pattern类与Matcher类.首先我们要清楚指定为字符串的正则表达式必须首先被编译为pattern类的实例.因此如何更好的了解这两个类,是编程人员必须知道的. 以下我们就分别来看看这两个类: 一.捕获组的概念 捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的.例如,在表达式 ((A)(B(C)))中,存在四个这样的组: 1 ((A)(B(C))) 2 (A) 3 (B(C)) 4 (C) 组零始终代表整个表达式. 以 (?) 开头的组是纯的

  • Java matches类,Pattern类及matcher类用法示例

    本文实例讲述了Java matches类,Pattern类及matcher类用法.分享给大家供大家参考,具体如下: Pattern类 正则表达式常见规则 A:字符     x 字符 x.举例:'a'表示字符a     \\ 反斜线字符.     \n 新行(换行)符 ('\u000A')     \r 回车符 ('\u000D') B:字符类     [abc] a.b 或 c(简单类),其中一个     [^abc] 任何字符,除了 a.b 或 c(否定)     [a-zA-Z] a到 z

  • Java正则表达式Pattern和Matcher原理详解

    这篇文章主要介绍了Java正则表达式Pattern和Matcher原理详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 基本使用 Scanner中的使用正则表达式 //Scanner 支持的分组 Scanner cin=new Scanner("red a bbc").useDelimiter("\\s*a\\s*"); System.out.println(cin.next()); System.out.pri

  • Java正则相关的Pattern和Matcher类及遇到的坑

    此篇文章是记录我在学习Java正则表达式时候学到的和遇到的坑. 先来说说 Matcher 里面的三个方法(取的结果以group()方法为例子) matches():整个匹配,只有整个字符序列完全匹配成功,才返回True,否则返回False.但如果前部分匹配成功,将移动下次匹配的位置.举个例子如果字符串为"a123",正则表达式为"\w\d\d\d",则matches()方法才返回true,换言之,就是要匹配的字符串需要跟正则表达式一一对应,字母对应字母,数字对应数字

  • java正则表达式之Pattern与Matcher类详解

    Pattern.split方法详解 /** * 测试Pattern.split方法 */ @Test public void testPatternSplit() { String str = "{0x40, 0x11, 0x00, 0x00}"; // 分割符为:逗号, {,}, 空白符 String regex = "[,\\{\\}\\s]"; Pattern pattern = Pattern.compile(regex); /* * 1. split 方法

  • Java TimedCache 带时间缓存工具类详解使用

    简述 我们在工作中会碰到需要使用带过期时间的缓存场景.但是使用redis有太重了,毕竟缓存的数据很小,放在内存够够的.hutools提供了TimedCache时间缓存工具,可以实现该场景.下面使用到该组件,并为了适配工作场景,对该工具类做优化升级. Maven依赖 <dependency> <groupId>cn.hutool</groupId> <artifactId>hutool-all</artifactId> <version>

  • java金额数字转中文工具类详解

    本文实例为大家分享了java金额数字转中文工具类的具体代码,供大家参考,具体内容如下 java金额数字转中文工具类ConvertNum.java package light.mvc.utils; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; /** * 金额数字转中文工具类 * * @author ardo * */ public class Convert

  • Java正则表达式之Pattern类实例详解

    目录 前言 Pattern 概述 Pattern 匹配模式(Pattern flags) 代码示例 多行模式:Pattern.MULTILINE 示例 忽略大小写:Pattern.CASE_INSENSITIVE 示例 启用注释:Pattern.COMMENTS 示例 启用 dotall 模式:Pattern.DOTALL 示例 平白字符模式 模式:Pattern.LITERAL 示例 附:贪婪匹配与懒惰匹配 总结 前言 这个系列的文章我们使用以下的顺序进行讲解: Pattern 详解: Mat

  • Java之Pattern.compile函数用法详解

    除了Pattern Pattern.compile(String regex), Pattern类的compile()方法还有另一个版本: Pattern Pattern.complie(String regex,int flag),它接受一个标记参数flag,以调整匹配的行为. flag来自以下Pattern类中的常量: 编译标记 效果 Pattern.CANON_EQ 两个字符当且仅当它们的完全规范分解相匹配时,就认为它们是匹配的,例如,如果我们指定这个标记,表达式a\u030A就会匹配字符

  • Java Scaner类详解_动力节点Java学院整理

    Java.util.Scanner是Java5.0的新特征,主要功能是简化文本扫描.这个类最实用的地方表现在获取控制台输入,其他的功能都很鸡肋,尽管Java API文档中列举了大量的API方法,但是都不怎么地. 一.扫描控制台输入  这个例子是常常会用到,但是如果没有Scanner,你写写就知道多难受了. 当通过new Scanner(System.in)创建一个Scanner,控制台会一直等待输入,直到敲回车键结束,把所输入的内容传给Scanner,作为扫描对象.如果要获取输入的内容,则只需要

  • 基于Java中的StringTokenizer类详解(推荐)

    StringTokenizer是字符串分隔解析类型,属于:Java.util包. 1.StringTokenizer的构造函数 StringTokenizer(String str):构造一个用来解析str的StringTokenizer对象.java默认的分隔符是"空格"."制表符('\t')"."换行符('\n')"."回车符('\r')". StringTokenizer(String str,String delim)

  • java LinkedList类详解及实例代码

    java  LinkedList类详解 LinkedList的特有功能 A:添加功能 public void addFirst(Object e); public void addLast(Object e); B:特有功能 public Object getFirst(); public Object getLast(); C:删除功能 public Object removeFirst(); public Object removeLast(); 实例代码: import java.util

随机推荐