一文搞懂Java正则表达式的使用

目录
  • 1.什么是正则表达式
  • 2.快速入门案例
  • 3.正则表达式语法
    • 转义符号
    • 字符匹配符
    • 字符匹配符演示
    • 选择匹配符
    • 正则限定符
    • 正则定位符

1.什么是正则表达式

在了解正则表达式之前,我们先看几个非常常见的问题:

如何判断字符串是否是有效的电话号码?例如:010-1234567,123ABC456,13510001000等;

如何判断字符串是否是有效的电子邮件地址?例如:test@example.com,test#example等;

如何判断字符串是否是有效的时间?例如:12:34,09:60,99:99等。

一种直观的想法是通过程序判断,这种方法需要为每种用例创建规则,然后用代码实现。

为每一种判断逻辑编写代码实在是太繁琐了。有没有更简单的方法?

有!用正则表达式!

正则表达式可以用字符串来描述规则,并用来匹配字符串。例如,判断手机号,我们用正则表达式\d{11}

使用正则表达式的好处有哪些?一个正则表达式就是一个描述规则的字符串,所以,只需要编写正确的规则,我们就可以让正则表达式引擎去判断目标字符串是否符合规则。

正则表达式是一套标准,它可以用于任何语言。Java标准库的java.util.regex包内置了正则表达式引擎,在Java程序中使用正则表达式非常简单。

2.快速入门案例

找到文本中的所有英文单词(含字母):

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 正则表达式快速入门
 */
public class HelloRegularExpression {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。";

        // 实例:找到文本中的所有英文单词(含字母)
        // 先创建一个Pattern模式对象
        Pattern pattern = Pattern.compile("[a-zA-Z]+");
        // 创建一个匹配器对象
        Matcher matcher = pattern.matcher(content);
        // 开始匹配
        while (matcher.find()) {
            System.out.println("找到:" + matcher.group(0));
        }
    }
}

输出:

找到:Go
找到:C
找到:Go
找到:Go
找到:CSP
找到:Occam
找到:Limbo
找到:Pi
找到:Plugin
找到:Go
找到:C
找到:Go
找到:Slice
找到:Interface
找到:Go
找到:Java
找到:Go
找到:Hashes
找到:Dictionaries

3.正则表达式语法

转义符号

当我们在检索某些字符时,需要用到转义符号,否则检索不到结果,甚至发生错误

在正则表达式中,两个\\代表其他语言中的一个\

字符匹配符

[]   - 可接受的字符列表

[efgh] 表示可接收的efgh中的任意一个字符

[^]   - 不可接受的字符列表

^abc 表示除了abc之外的任意一个字符,包括数字和特殊字符

-   - 连字符

A-Z 表示任意一个大写字母

.   - 匹配除\n以外的任意一个字符

a..b 以a开头,b结尾,中间包括2个任意字符的长度为4的字符串

\\d   - 匹配单个数字字符

\\d{3}(\\d)? 包含3个或者4个数字的字符串

\\D 匹配单个非数字字符

\\D(\\d)* 以单个非数字字符开头,后接任意个数字字符串

\\w 匹配单个数字、大小写字符

\\d{3}\\w{4} 以三个数字字符开头的长度为7的数字字母字符串

\\W 匹配非数字字母字符串

\\W+\\d{2} 以至少一个非数字字母字符开头,2个数字字符结尾的字符串

字符匹配符演示

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 正则表达式快速入门
 */
public class HelloRegularExpression {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。a11c8abcABCaBc";

        // 实例:找到文本中的所有英文单词(含字母)
        // 先创建一个Pattern模式对象
        Pattern pattern = Pattern.compile("[a-zA-Z]+");
        // 创建一个匹配器对象
        Matcher matcher = pattern.matcher(content);
        // 开始匹配
        while (matcher.find()) {
            System.out.println("找到:" + matcher.group(0));
        }

        // 实例:找到a-z之间的任意一个字符
        Pattern pattern1 = Pattern.compile("[a-z]");
        Matcher matcher1 = pattern1.matcher(content);
        while (matcher1.find()) {
            System.out.println("2找到:" + matcher1.group(0));
        }

        // 实例:找到abc字符,不区分大小写
        Pattern pattern2 = Pattern.compile("(?i)abc");
        Matcher matcher2 = pattern2.matcher(content);
        while (matcher2.find()) {
            System.out.println("3找到:" + matcher2.group(0));
        }

        // 实例:找到abc字符,b不区分大小写
        Pattern pattern3 = Pattern.compile("a((?i)b)c");
        Matcher matcher3 = pattern3.matcher(content);
        while (matcher3.find()) {
            System.out.println("4找到:" + matcher3.group(0));
        }

        // 实例:找到abc字符,不区分大小写,设置参数的方式
        Pattern pattern4 = Pattern.compile("abc", Pattern.CASE_INSENSITIVE);
        Matcher matcher4 = pattern4.matcher(content);
        while (matcher4.find()) {
            System.out.println("5找到:" + matcher4.group(0));
        }

        // 实例:找到非数字字母字符的所有字符(含中文)
        Pattern pattern5 = Pattern.compile("\\W", Pattern.CASE_INSENSITIVE);
        Matcher matcher5 = pattern5.matcher(content);
        while (matcher5.find()) {
            System.out.println("6找到:" + matcher5.group(0));
        }
    }
}

选择匹配符

|   - 多个条件满足一个即可匹配成功

例如:匹配文本中的Go/C/Java中的任意一个字符串

String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
        "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
        "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
        "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
        "函数。\n" +
        "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
        "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
        "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
        "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
        "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
        "(Dictionaries) ),就像字符串类型一样。a11c8abcABCaBc";

Pattern pattern = Pattern.compile("Go|C|Java");
Matcher matcher = pattern.matcher(content);
while (matcher.find()) {
    System.out.println("找到:" + matcher.group(0));
}

正则限定符

*   - 指定字符重复0次或n次

示例:(abc)* 指定abc字符串重复0次或者n次

实例:abc,abcabcabc

+   - 指定字符重复1次或n次

示例:m+(abc)* 指定以至少一个m开头,后面接任意个abc的字符串

实例:m,mabc,mmabcabc

?   - 指定字符重复0次或者1次

示例:m+abc? 指定以至少一个m开头,后面是ab或者abc的字符串

实例:mab,mmabc

{n}   - 只能输入n个字符

示例:[abcd]{3} 由abcd字符组成的任意长度为3的字符串

实例:abc,dbc,adc

{n,}   - 指定至少n个匹配

示例:[abcd]{3,} 由abcd组成的任意长度不小于3的字符串

实例:aab,aaadbc

{n,m}   - 指定至少n个但是不多于m个匹配

注意:java的匹配是贪婪匹配,即尽可能匹配多的,即优先匹配m个字符

示例:[abcd]{3,5} 由abcd组成的任意长度不小于3大于5的字符串

实例:abc,aaabb

代码演示:(匹配六个a)

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * 正则限定符
 */
public class Qualifier {
    public static void main(String[] args) {
        String content = "Go的语法接近C语言,但对于变量的声明有所不同。Go支持垃圾回收功能" +
                "。Go的并行模型是以东尼·霍尔的通信顺序进程(CSP)为基础,采取类似模型的" +
                "其他语言包括Occam和Limbo,但它也具有Pi运算的特征,比如通道传输。在" +
                "1.8版本中开放插件(Plugin)的支持,这意味着现在能从Go中动态加载部分" +
                "函数。\n" +
                "与C++相比,Go并不包括如枚举、异常处理、继承、泛型、断言、虚函数等功" +
                "能,但增加了 切片(Slice) 型、并发、管道、垃圾回收、接口" +
                "(Interface)等特性的语言级支持。Go 2.0版本将支持泛型,对于断言的" +
                "存在,则持负面态度,同时也为自己不提供类型继承来辩护。\n" +
                "不同于Java,Go内嵌了关联数组(也称为哈希表(Hashes)或字典" +
                "(Dictionaries) ),就像字符串类型一样。aaaaaa11c8abcABCaBc";

        // 匹配六个a
        Pattern pattern = Pattern.compile("a{6}");
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()) {
            System.out.println("找到:" + matcher.group(0));
        }
    }
}

正则定位符

^   - 指定起始字符

示例:^[0-9]+[a-z]* 以至少1个数字开头,后接任意个小写字母的字符串

实例:123,6aa,555edf

$   - 指定结束字符

示例:^[0-9]\\-[a-z]+$ 以至少一个数字开头连接-并以至少一个小写字母结尾的字符串

实例:1-a,2-abc

程序演示:

Pattern pattern = Pattern.compile("^[0-9]+[a-z]*");
Matcher matcher = pattern.matcher("123abc");
while (matcher.find()) {
    System.out.println("找到:" + matcher.group(0));
}

Pattern pattern2 = Pattern.compile("^[0-9]\\-[a-z]+$");
Matcher matcher2 = pattern2.matcher("1-a");
while (matcher2.find()) {
    System.out.println("找到:" + matcher2.group(0));
}

输出:

找到:123abc
找到:1-a

\\b   - 匹配目标字符串的边界(结尾)

示例:guo\\b 字串间有空格,或者是目标字符串的结尾位置匹配guo

实例:yunyunguo nanguo

\\B   - 匹配目标字符串的边界(开头)

示例:guo\\B 字串间有空格,或者是目标字符串的开头位置匹配guo

实例:guoyunyun guotime

以上就是一文搞懂Java正则表达式的使用的详细内容,更多关于Java正则表达式的资料请关注我们其它相关文章!

(0)

相关推荐

  • 深入浅解正则表达式在Java中的使用

    介绍 •正则表达式一般用于字符串匹配, 字符串查找和字符串替换. 别小看它的作用, 在工作学习中灵活运用正则表达式处理字符串能够大幅度提高效率, 编程的快乐来得就是这么简单. •一下子给出一堆匹配的规则可能会让人恐惧, 下面将由浅入深讲解正则表达式的使用. 从简单例子认识正则表达式匹配 •先上代码 public class Demo1 { public static void main(String[] args) { //字符串abc匹配正则表达式"...", 其中".&q

  • Java 简化正则表达式的使用

    使用 RegexString.with(string).pattern(pattern).start() + 后续操作(matches,find或者是replace) 源码 package com; import java.util.Objects; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * @author YouXianMing1987@iCloud.com 用于简化处理正则表达式 */ publ

  • 如何在Java中使用正则表达式API

    目录 Java正则表达式包 简单的例子 Meta Characters元字符 Character类 OR NOR Range类 Union类 Intersection类 Subtraction类 前言: 在正则表达式的世界中,有许多不同的风格可供选择,比如grep.Perl.Python.PHP.awk等等.这意味着在一种编程语言中工作的正则表达式可能在另一种编程语言中不工作.Java中的正则表达式语法与Perl中的最相似.要在Java中使用正则表达式,我们不需要任何特殊设置.JDK包含一个特殊

  • 在Java中使用基本的正则表达式

    一.正则表达式简介 正则表达式是使用单个字符串来描述.匹配一系列匹配某个句法规则的字符串.爬虫中解析html可以使用正则来方便的提取信息 二.正则表达式匹配规则 模式 描述 \w 匹配字母.数字.下划线 \W 匹配非字母.数字.下划线 \s 匹配任意空白字符,相当于[\t\n\r\f] \S 匹配任意非空字符 \d 匹配任意数字,相当于[0-9] \D 匹配非数字的字符 \A 匹配字符串开头 \Z 匹配字符串结尾,如果存在换行,只匹配到换行前的结束字符串 \z 匹配字符串结尾,如果存在换行,同时

  • Java 正则表达式详细使用

    Java 正则表达式的使用,具体内容如下所示: java.util.regex.Pattern java.util.regex.Matcher 1.Match match 是从字符串最头部开始匹配,一直到结束,需要匹配整个串 String content = "Welcome, bob!"; content.match("bob"); //false content.match(".*bob") //false content.match(&qu

  • 整理很详细的Java正则表达式使用大全

    本文的全部内容都是针对Java正则表达式语法进行整理的,分享给大家: [正则表达式]文本框输入内容控制 整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$ 只能输入数字:"^[0-9]*$". 只能输入n位的数字:"^\d{n}$". 只能输入至少n位的数字:"^\d{n,}$". 只能输入m~n位的数字:."^\d{m,n}$" 只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$&quo

  • 一文搞懂Java正则表达式的使用

    目录 1.什么是正则表达式 2.快速入门案例 3.正则表达式语法 转义符号 字符匹配符 字符匹配符演示 选择匹配符 正则限定符 正则定位符 1.什么是正则表达式 在了解正则表达式之前,我们先看几个非常常见的问题: 如何判断字符串是否是有效的电话号码?例如:010-1234567,123ABC456,13510001000等: 如何判断字符串是否是有效的电子邮件地址?例如:test@example.com,test#example等: 如何判断字符串是否是有效的时间?例如:12:34,09:60,

  • 一文搞懂JAVA 修饰符

    Java语言提供了很多修饰符,主要分为以下两类: 访问修饰符 非访问修饰符 修饰符用来定义类.方法或者变量,通常放在语句的最前端.我们通过下面的例子来说明: public class ClassName { // ... } private boolean myFlag; static final double weeks = 9.5; protected static final int BOXWIDTH = 42; public static void main(String[] argum

  • 一文搞懂JAVA 枚举(enum)

    Java 枚举是一个特殊的类,一般表示一组常量,比如一年的 4 个季节,一个年的 12 个月份,一个星期的 7 天,方向有东南西北等. Java 枚举类使用 enum 关键字来定义,各个常量使用逗号 , 来分割. 例如定义一个颜色的枚举类. enum Color { RED, GREEN, BLUE; } 以上枚举类 Color 颜色常量有 RED, GREEN, BLUE,分别表示红色,绿色,蓝色. 使用实例: enum Color { RED, GREEN, BLUE; } public c

  • 一文搞懂Java中的反射机制

    前一段时间一直忙,所以没什么时间写博客,拖了这么久,也该更新更新了.最近看到各种知识付费的推出,感觉是好事,也是坏事,好事是对知识沉淀的认可与推动,坏事是感觉很多人忙于把自己的知识变现,相对的在沉淀上做的实际还不够,我对此暂时还没有什么想法,总觉得,慢慢来,会更快一点,自己掌握好节奏就好. 好了,言归正传. 反射机制是Java中的一个很强大的特性,可以在运行时获取类的信息,比如说类的父类,接口,全部方法名及参数,全部常量和变量,可以说类在反射面前已经衣不遮体了(咳咳,这是正规车).先举一个小栗子

  • 一文搞懂Java的SPI机制(推荐)

    目录 1 简介 缺点 源码 使用 适用场景 插件扩展 案例 1 简介 SPI,Service Provider Interface,一种服务发现机制. 有了SPI,即可实现服务接口与服务实现的解耦: 服务提供者(如 springboot starter)提供出 SPI 接口.身为服务提供者,在你无法形成绝对规范强制时,适度"放权" 比较明智,适当让客户端去自定义实现 客户端(普通的 springboot 项目)即可通过本地注册的形式,将实现类注册到服务端,轻松实现可插拔 缺点 不能按需

  • 一文搞懂Java MD5算法的原理及实现

    目录 MD5加密简介 MD5加密原理 MD5加密常用方法 MD5加密简介 哈希算法又称散列算法,是将任何数据转换成固定长度的算法的统称. 从本质上讲,MD5也是一种哈希算法,其输出是生成128位的输出结果. 如果输入两个不同的明文,就会输出两个不同的输出值,并且根据输出值,不能得到原始的明文,这个过程是不可逆的. MD5加密原理 MD5算法对512位报文的输入信息进行处理,每个报文被分成16个32位报文. 经过一系列处理后,算法的输出由4个32位的数据包组成,这些数据包级联生成一个128位的哈希

  • 一文搞懂Java创建线程的五种方法

    目录 题目描述 解题思路 代码详解 第一种 继承Thread类创建线程 第二种:实现Runnable接口创建线程 第三种:实现Callable接口,通过FutureTask包装器来创建Thread线程 第四种:使用ExecutorService.Callable(或者Runnable).Future实现返回结果的线程 第五种:使用ComletetableFuture类创建异步线程,且是据有返回结果的线程 题目描述 Java创建线程的几种方式 Java使用Thread类代表线程,所有线程对象都必须

  • 一文搞懂Java中的注解和反射

    目录 1.注解(Annotation) 1.1 什么是注解(Annotation) 1.2 内置注解 1.3 元注解(meta-annotation) 1.4 自定义注解 2.反射(Reflection) 2.1 反射和反射机制 2.2 Class类的获取方式和常用方法 2.3 反射的使用 1.注解(Annotation) 1.1 什么是注解(Annotation) 注解不是程序本身,可以在程序编译.类加载和运行时被读取,并执行相应的处理.注解的格式为"@注释名(参数值)",可以附加在

  • 一文搞懂Java中对象池的实现

    目录 1. 什么是对象池 2. 为什么需要对象池 3. 对象池的实现 4. 开源的对象池工具 5. JedisPool 对象池实现分析 6. 对象池总结 最近在分析一个应用中的某个接口的耗时情况时,发现一个看起来极其普通的对象创建操作,竟然每次需要消耗 8ms 左右时间,分析后发现这个对象可以通过对象池模式进行优化,优化后此步耗时仅有 0.01ms,这篇文章介绍对象池相关知识. 1. 什么是对象池 池化并不是什么新鲜的技术,它更像一种软件设计模式,主要功能是缓存一组已经初始化的对象,以供随时可以

  • 一文搞懂Java桥接方法

    目录 1.桥接方法简介 2. 什么时候会生成桥接方法 3. 为什么生成泛型方法 4. 根据桥接方法获取实际泛型方法 1.桥接方法简介 桥接方法是jdk1.5引入泛型后,为使java泛型方法生成的字节码与jdk1.5版本之前的字节码兼容由编译器自动生成的. 可用method.isBridge()判断method是否是桥接方法,在生成的字节码中会有flags标记 ACC_BRIDGE, ACC_SYNTHETIC ,根据来自深入理解java虚拟机的一张访问标志图可以看到 ACC_BRIDGE表示方法

随机推荐