Java正则环视和反向引用功能与用法详解

本文实例讲述了Java正则环视和反向引用功能与用法。分享给大家供大家参考,具体如下:

环视

1、环视概念

环视,又称为零宽断言,简称断言。

环视强调位置(前面或后面),必须匹配环视表达式,才能匹配成功。

环视可认为是虚拟加入到它所在位置的附加判断条件,并不消耗正则的匹配字符。

2、环视基础表达式

(?=Expression) 顺序肯定环视,表示所在位置右侧能够匹配Expression
(?!Expression) 顺序否定环视,表示所在位置右侧不能匹配Expression
(?<=Expression) 逆序肯定环视,表示所在位置左侧能够匹配Expression
(?<!Expression) 逆序否定环视,表示所在位置左侧不能匹配Expression

Note:顺序(=)右侧匹配,逆序环视比顺序环视多了个<。

JavaScript中只支持顺序环视,不支持逆序环视。

Java中虽然顺序环视和逆序环视都支持,但是逆序环视只支持长度确定的表达式,逆序环视中量词只支持?,不支持其它长度不定的量词。

3、使用示例

3.1、顺序肯定环视(?=Expression)

3.1.1、匹配后缀结尾是“.txt”的不含后缀的文件名

【.+(?=\.txt)】

文本:

txtfile.txt
exefile.exe
inifile.ini

匹配结果:txtfile

3.1.2、匹配密码(必须包含字母(不区分大小写)、数字,6-16位)
【^(?=.*?[a-zA-Z])(?=.*?[0-9])[a-zA-Z0-9]{6,16}$】

(?=.*?[a-zA-Z]) 限定后面的字符中至少有一个字母,使用 (?=.*?[0-9]) 限定后面的字符中至少有一个数字,最后通过实际匹配正则 [a-zA-Z0-9]{6,16} 限定量词。

3.2、顺序否定环视(?!Expression)

3.2.1、匹配除<a></a>之外的标签

【<(?!/?a\b)[^<]+?>】

文本:<a><a1></a>zxiaofan<div>com</d>iv>cc

匹配结果:

<a1>
<div>
</d>

3.2.2、匹配后缀结尾不是“.txt”的含后缀的文件名

【.+(?!\.txt)】表达式错误,因为.+没有指定位置且是贪婪匹配。(因此.+就能直接匹配txtfile.txt了)
【(.+)(?!\.txt)\.[^.]+$】

文本:

txtfile.txt
exefile.exe
inifile.ini

匹配结果:

exefile.exe
inifile.ini

3.3、逆序肯定环视(?<=Expression)

3.3.1、匹配指定标签之间的内容

【(?<=<div>)[^<]+(?=</div>)】

文本:<div>zxiaofan.com</div>

匹配结果:zxiaofan.com

3.3.2、获取指定参数的值

【(?<=name=).+】

文本:

name=zxiaofan
age=20
level=6

匹配结果:zxiaofan

3.4、逆序否定环视(?<!Expression)

3.4.1、获取非指定参数的值

【^[^=#]+=(?<!name=).+$】

文本:

name=zxiaofan
age=20
level=6
#sex=1

匹配结果:

age=20
level=6

4、综合示例

4.1、必须包含字母、数字、特殊字符

【^(?=.*?[a-zA-Z])(?=.*?\d)(?![a-zA-Z\d]+$).+$】

解释:^(?=.*?[a-zA-Z])限制必须有字母;(?=.*?\d)限制必须有数字;(?![a-zA-Z\d]+$)限制不能全为数字和字母。

4.2、匹配主域名(匹配顶级域名)

【(?<=(?:://\w{0,50}\.)?)(?:\w{0,50}\.)(?:com\.cn|net\.cn|org\.cn|com|net|org|cn|biz|info|cc|tv)】

文本:

vip.zxiaofan.com.cn
http://zxiaofan.com/123
www.zxiaofan.org.cn

匹配结果:

zxiaofan.com.cn
zxiaofan.com
zxiaofan.org.cn

Note:【?:】不捕获匹配的文本到自动命名的组,也不给此组分配组好。(去掉后不影响结果)
特殊域名:万网www.net.cn

4.3、匹配5连号手机号码

【1[34578]\d{3}(\d)(?!\1{1})(\d)\2{4}】

文本:

18328501111
18328511111
18328551111
18328111111

匹配结果:

18328511111

Note1:\1匹配第一组内容
Note2:(?!\1{1})过滤6连号的号码

反向引用

1、反向引用概念

捕获组:按照()子表达式划分成若干组;每出现一对()就是一个捕获组;引擎会对捕获组进行编号,编号规则是左括号(从左到右出现的顺序,从1开始编号。

捕获组命名:

(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp);
(?:exp) 匹配exp,不捕获匹配的文本到自动命名的组,也不给此分组分配组号。

反向引用:

\1表示第一组(abc);\2表示第二组;
\k<Word>:引用指定名字的组。

2、使用示例

2.1、匹配首尾相同的文件名

【([a-z]{3})[a-z]+\.\1{1}】

文本:

txtfile.txt
exefile.txt
fileini.ini

匹配结果:

txtfile.txt

Note:([a-z]{3})为第一组,\1{1}表示引用第一组一次(这里不能写成\1{3})。

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

更多关于java算法相关内容感兴趣的读者可查看本站专题:《Java正则表达式技巧大全》、《Java数据结构与算法教程》、《Java操作DOM节点技巧总结》、《Java文件与目录操作技巧汇总》和《Java缓存操作技巧汇总》

希望本文所述对大家java程序设计有所帮助。

您可能感兴趣的文章:

  • 正则表达式中环视的简单应用示例【基于java】
  • Java 正则表达式详解
  • JAVA正则表达式 Pattern和Matcher
  • Java正则多字符串匹配替换
  • java正则表达式验证邮箱、电话号码示例
  • java正则表达式四种常用的处理方式(匹配、分割、替代、获取)
  • Java/Js下使用正则表达式匹配嵌套Html标签
  • Java正则表达式过滤出字母、数字和中文
  • JAVA中正则表达式匹配,替换,查找,切割的方法
  • 用Java正则去掉字符串中重复出现的字符
(0)

相关推荐

  • Java/Js下使用正则表达式匹配嵌套Html标签

    通用 HTML 标签区配正则 最近看网站日志,发现有人在博客上转了我不知道几年前写的一个匹配 HTML 标签的正则,刚好最近也在做一些相关的事情,顿时来了兴趣.就拿回来改改,成了下面这样,可能会有一些 case 遗漏,欢迎修改,已知在内嵌 <script> 复杂内容的处理能力较弱,不过对纯 HTML 来说已经够用,拿来做一些分析工具还是不错滴. 复制代码 代码如下: <script type="text/javascript"> var str = "

  • JAVA中正则表达式匹配,替换,查找,切割的方法

    正则表达式的查找;主要是用到String类中的split(); String str; str.split();方法中传入按照什么规则截取,返回一个String数组 常见的截取规则: str.split("\\.")按照.来截取 str.split(" ")按照空格截取 str.split("cc+")按照c字符来截取,2个c或以上 str.split((1)\\.+)按照字符串中含有2个字符或以上的地方截取(1)表示分组为1 截取的例子; 按照

  • JAVA正则表达式 Pattern和Matcher

    1.简介: java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式. Matcher 一个Matcher对象是一个状态机器,它依据Pattern对象做为匹配模式对字符串展开匹配检查. 首先一个Pattern实例订制了一个所用语法与PERL的类似的正则表达式经编译后的模式,然后一个Matcher实例在这个给定的Pattern实例的模式控制下进行字

  • Java正则多字符串匹配替换

    Java中使用也比较简单:1. 编译正则表达式的字面值得到对应的模式Pattern对象: 2. 创建匹配给定输入与此模式的匹配器Matcher: 3. 通过匹配器对象执行操作,匹配器对象的方法很丰富,方法之间组合使用更加强大. 复制代码 代码如下: public static void main(String[] args) {     //被替换关键字的的数据源     Map<String,String> tokens = new HashMap<String,String>(

  • Java正则表达式过滤出字母、数字和中文

    1.Java中过滤出字母.数字和中文的正则表达式 (1)过滤出字母的正则表达式 [^(A-Za-z)] (2) 过滤出 数字 的正则表达式 [^(0-9)] (3) 过滤出 中文 的正则表达式 [^(\\u4e00-\\u9fa5)] (4) 过滤出字母.数字和中文的正则表达式 [^(a-zA-Z0-9\\u4e00-\\u9fa5)] 2.实例源码 ** * @Title:FilterStr.java * @Package:com.you.dao * @Description:Java中过滤数

  • java正则表达式验证邮箱、电话号码示例

    下面的代码使用正则表达式验证输入格式包括了验证邮箱和验证手机号码 复制代码 代码如下: package com.firewolf.utils; import java.util.regex.Matcher; import java.util.regex.Pattern; /**  * 使用正则表达式验证输入格式  * @author liuxing  *  */ public class RegexValidateUtil {  public static void main(String[]

  • 用Java正则去掉字符串中重复出现的字符

    String str = "abcdeabcdeabcdeaaaaaadddddceeeeabcccccccacadaeec"; str = str.replaceAll(reg, ""); System.out.println(str); str = str.replaceAll("(?s)(.)(?=.*\\1)", ""); (?s)(.)(?=.*\1) (?s) 开启单行模式 DOTALL 让. 号匹配任意字符 (.

  • java正则表达式四种常用的处理方式(匹配、分割、替代、获取)

    java 正则表达式高级篇,介绍四种常用的处理方式:匹配.分割.替代.获取,具体内容如下 package test; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * 正则表达式 * 正则表达式 的用法主要是4种方面的使用 * 匹配,分割,替换,获取. * 用一些简单的符号来代表代码的操作 * @author cyc * */ public class Rex { public static void ma

  • Java 正则表达式详解

    如果你不熟悉这个术语,那么"正则表达式"(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式. 正则表达式30分钟入门教程 常用正则表达式 许多语言,包括Perl.PHP.Python.JavaScript和JScript,都支持用正则表达式处理文本,一些文本编辑器用正则表达式实现高级"搜索-替换"功能.那么Java又怎样呢?本文写作时,一个包含了用正则表达式进行文本处理的Java规范需求(Specification R

  • 正则表达式中环视的简单应用示例【基于java】

    本文实例讲述了正则表达式中环视的简单应用.分享给大家供大家参考,具体如下: 由于开发工作需要对文本中内容进行过滤,删除或替换掉一些无用的或不符合要求的信息.于是发现一个问题,某一类工程性文本中,用到很多英文写法相同.但含义不同的单位,需要将其分别转为真实含义对应的汉字.比如:"粘度为17s,移动距离为350厘米,要求混凝土必须内实外光.振捣时间为30s.",很明显第一个s是粘度的单位,第二s是时间单位,现在需要将文本中所有表示时间的s替换为"秒",在朋友指引下,发现

随机推荐