半小时精通正则表达式 经典实例介绍

开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明
如果您是新手,猜你取消 正则表达式30分钟入门教程
"^The": 开头一定要有"The"字符串;
"of despair$": 结尾一定要有"of despair" 的字符串;
那么,
"^abc$": 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配
"notice": 匹配包含notice的字符串
你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可以出现在被检验字符串的任何地方,你没有把他锁定到两边
接着,说说 '*', '+',和 '?',
他们用来表示一个字符可以出现的次数或者顺序. 他们分别表示:
"zero or more"相当于{0,},
"one or more"相当于{1,},
"zero or one."相当于{0,1}, 这里是一些例子:
"ab*": 和ab{0,}同义,匹配以a开头,后面可以接0个或者N个b组成的字符串("a", "ab", "abbb", 等);
"ab+": 和ab{1,}同义,同上条一样,但最少要有一个b存在 ("ab", "abbb", 等.);
"ab?":和ab{0,1}同义,可以没有或者只有一个b;
"a?b+$": 匹配以一个或者0个a再加上一个以上的b结尾的字符串.
要点, '*', '+',和 '?'只管它前面那个字符.
你也可以在大括号里面限制字符出现的个数,比如
"ab{2}": 要求a后面一定要跟两个b(一个也不能少)("abb");
"ab{2,}": 要求a后面一定要有两个或者两个以上b(如"abb", "abbbb", 等.);
"ab{3,5}": 要求a后面可以有2-5个b("abbb", "abbbb", or "abbbbb").

现在我们把一定几个字符放到小括号里,比如:
"a(bc)*": 匹配 a 后面跟0个或者一个"bc";
"a(bc){1,5}": 一个到5个 "bc."
还有一个字符 '│', 相当于OR 操作:
"hi│hello": 匹配含有"hi" 或者 "hello" 的 字符串;
"(b│cd)ef": 匹配含有 "bef" 或者 "cdef"的字符串;
"(a│b)*c": 匹配含有这样多个(包括0个)a或b,后面跟一个c
的字符串;
一个点('.')可以代表所有的单一字符,不包括"\n"
如果,要匹配包括"\n"在内的所有单个字符,怎么办?
对了,用'[\n.]'这种模式.
"a.[0-9]": 一个a加一个字符再加一个0到9的数字
"^.{3}$": 三个任意字符结尾 .

中括号括住的内容只匹配一个单一的字符
"[ab]": 匹配单个的 a 或者 b ( 和 "a│b" 一样);
"[a-d]": 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样); 一般我们都用[a-zA-Z]来指定字符为一个大小写英文
"^[a-zA-Z]": 匹配以大小写字母开头的字符串
"[0-9]%": 匹配含有 形如 x% 的字符串
",[a-zA-Z0-9]$": 匹配以逗号再加一个数字或字母结尾的字符串
你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^'

-------------------------------------------------------------------------
^ 和 $ 分别用来匹配字符串的开始和结束
-------------------------------------------------------------------------

例1 ^<b> 开头 一定要有"<b>"字符串;
例2 </b>$ 结尾 一定要有"</b>" 的字符串;
例3 ^abc$ 以abc开头和以abc结尾的字符串,实际上是只有abc匹配
例4 abc 没符号就 匹配包含abc的字符串

-------------------------------------------------------------------------
* + 和 ? 用来表示一个字符可以出现的次数或者顺序. 他们分别表示
-------------------------------------------------------------------------

{0,} = * 例1 ab{0,} 匹配以a开头后面B出现O-N次( "a", "ab", "abb", "abbbbbbbbbbbbbbbbb", 无限...)
{1,} = + 例2 ab{1,} 匹配以a开头后面B出现1-N次( "ab", "abb", "abbbbbbbbbbbbbbbbb", 无限...)
{0,1}= ? 例3 ab{0,1} 匹配以a开头后面B出现O-1次( "a", "ab")
例4 a{0,1}b+$ 匹配以0个或者1个a 再加上一个b结尾的字符串. ( "b", "ab")

注(2种写法)
ab{0,}也可以写成 ab*
ab{1,}也可以写成 ab+
ab{0,1}也可以写成 ab?
a{0,1}b+$也可以写成 a?b+$

(1)1要点, '*' '+',和 '?'只管控制它前面那个字符出现次数.
2 {N,N} 几到几次 {0} O次
3{}这个内不能为负数

(2)次数是可以修改的

例5 ab{2} 要求a后面一定要跟两个b(一个也不能少)如 ("abb");
例6 ab{2,} 要求a后面一定要有两个或者两个以上b 如("abb", "abbbb", 等.);
例7 ab{3,5} 要求a后面可以有2-5个b("abbb", "abbbb", or "abbbbb").

(3)后面跟多个字符用()
例8 a(bc)* 匹配 a 后面跟0个或者一个"bc"; 当然你也可以写成"a(bc){0,}"
例9 a(bc){1,5} 匹配1个到5个 "bc."

-------------------------------------------------------------------------
│ 相当于OR 用来表示 1个或者 多个或者
-------------------------------------------------------------------------

例1 A│B 匹配含有"A" 或者 "B" 的 字符串;
例2 (A│B)C 匹配含有 "AC" 或者 "BC"的字符串;
例3 (A│B)*C 匹配含有(包括0-1个)a或b,后面跟一个c

-------------------------------------------------------------------------
. 可以代表所有的单一字符
-------------------------------------------------------------------------
. 不包括"\n"空格 如果有空格就用 但空格加一字符[\n.] 多个空格+1字符 [\n\n\n\n\n\n.]

例1 a.[0-9] 一个a 加一个字符 再加一个0到9的数字
例2 ^.{3}$ 三个任意字符结尾

-------------------------------------------------------------------------
'[ab]' 中括号括住的内容只匹配一个单一的字符
-------------------------------------------------------------------------

例1 [ab] 匹配单个的 a 或者 b ( 和 "a│b" 一样);
例2 [a-d] 匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样); 一般我们都用[a-zA-Z]来指定字符为一个大小写英文
例3 ^[a-zA-Z] 匹配以大小写字母开头的字符串
例4 [0-9]% 匹配含有 形如 x% 的字符串
例5 ,[a-zA-Z0-9]$ 匹配以逗号再加一个数字或字母结尾的字符串
例6 %[^a-zA-Z]% 匹配含有两个百分号里面有一个(非)字母的字符串.

你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^'

要点1:^[内容] ^在[]外开头,就表示以内容开头
要点2:[^内容] ^在[]里开头,就表示排除里面的内容(^非的意思)
要点3: 匹配含有这些字符的字符串. 在中括号里[*\+?{}.] 或者' 符号将失效 括号只匹配单一字符
要点4: []中含有']' 最好把它作为列表里的第一个字符(可能跟在'^'后面)
要点5: []中含有有'-' 最好把它放在最前面或者最后面, or 或者一个范围的第二个结束点[a-d-0-9]中间的'-'将有效.

-------------------------------------------------------------------------
\b 和 \B 1匹配一个单词右边界 2匹配非单词边界
-------------------------------------------------------------------------

例1 've\b': 可以匹配love里的ve而不匹配very里有ve
例2 'ov\B': 可以匹配love里的ov而不匹配ovry里有ov

-------------------------------------------------------------------------
\d 和 \D
-------------------------------------------------------------------------

例1 \d 匹配一个数字字符。等价于 [0-9]。
例2 \D 匹配一个非数字字符。等价于 [^0-9]。

-------------------------------------------------------------------------
\w 和 \W
-------------------------------------------------------------------------
例1 \w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'
例2 \W 匹配包括下划线的任何非单词字符。等价于 '[^A-Za-z0-9_]'。

-------------------------------------------------------------------------
匹配非打印字符
-------------------------------------------------------------------------
字符 含义
\cx 匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符。
\f 匹配一个换页符。等价于 \x0c 和 \cL。
\n 匹配一个换行符。等价于 \x0a 和 \cJ。
\r 匹配一个回车符。等价于 \x0d 和 \cM。
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t 匹配一个制表符。等价于 \x09 和 \cI。
\v 匹配一个垂直制表符。等价于 \x0b 和 \cK。

-------------------------------------------------------------------------
例子
-------------------------------------------------------------------------

匹配首尾空白字符的正则表达式:^s*|s*$
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配网址URL的正则表达式:[a-zA-z]+://[^s]*

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配国内电话号码:d{3}-d{8}|d{4}-d{7} 匹配形式如 0511-4405222 或 021-87888822 920-209 642-964
匹配腾讯qq号:[1-9][0-9]{4,} 1+后面四为的数字开始,也就是 10000
匹配中国邮政编码:[1-9]d{5}(?!d) 中国邮政编码为6位数字
匹配身份证:d{15}|d{18}评注:中国的身份证为15位或18位
匹配ip地址:d+.d+.d+.d+  评注:提取ip地址时有用

-------------------------------------------
^ $ //开始到结尾
+ //连续1-N个 (连在一起的)(也就是-{1,} )
-? //表示负和非负 (也就是-{0,1} )
[0-9]* //表示前面的位数0-N(也就是[0-9]{0,} )
.? //表示有点或者无点
[^ //非里面的内容

[a-z] //匹配所有的小写字母
[A-Z] //匹配所有的大写字母
[a-zA-Z] //匹配所有的字母
[0-9] //匹配所有的数字 0-9的整数
[0-9.-] //匹配所有的数字,句号和减号

------------------------------------------------

^[a-zA-Z0-9_]+$ //所有包含一个以上的字母、数字或下划线的字符串 //举例子连在一起 aA0_A001a_
^[0-9]+$ //所有的正数 (也可以说是非负整数) //举例子 345500687008099900999
^-?[0-9]+$ //所有的整数 (包括 负整数和整数) //举例子 -43443 或者 43443
^-?[0-9]*.?[0-9]*$ //所有的小数 (包括正 副小数 小数点前后的位数无限长) //举例子 -10.00 或者100000.0000
如果没小数点 后面肯定没数字, 所以前面加一个.? 来判断是否有小数点,按道理说可以不需要.?是多余的
因为这个是专门判断小数的,如果没小数点了,还叫付数吗
[^a-z] //除了小写字母以外的所有字符
[^/^] //除了"/"和"^"字符之外的所有字符
[^"'] //除了双引号(")和单引号(')之外的所有字符

这篇文章以实例为主,方便有经验的朋友,如果没有相关经验可以看我们的正则表达式30分钟入门教程

(0)

相关推荐

  • php半小时精通正则表达式

    想必很多人都对正则表达式都头疼.今天,我以我的认识,加上网上一些文章,希望用常人都可以理解的表达方式.来和大家分享学习经验. 开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明: "^The":开头一定要有"The"字符串: "of despair$":结尾一定要有"of despair" 的字符串: 那么, "^abc$":就是要求以abc开头和以abc结尾的字符串,实际

  • 半小时精通正则表达式-精华版

    虽然我们以前发不过不少的正则表达式教程,但这篇文章还是不错的,无废话都是比较实际的,前提就是需要你之前懂点正则表达式,要不还是先看些基本的正则表达式教程比较好. ------------------------------------------------------------------------- ^ 和 $ 分别用来匹配字符串的开始和结束 -------------------------------------------------------------------------

  • 半小时精通正则表达式 经典实例介绍

    开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明 如果您是新手,猜你取消 正则表达式30分钟入门教程"^The": 开头一定要有"The"字符串; "of despair$": 结尾一定要有"of despair" 的字符串; 那么, "^abc$": 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配 "notice": 匹配包含no

  • Mybatis实战教程之入门到精通(经典)

    什么是mybatis MyBatis是支持普通SQL查询,存储过程和高级映射的优秀持久层框架.MyBatis消除了几乎所有的JDBC代码和参数的手工设置以及结果集的检索.MyBatis使用简单的XML或注解用于配置和原始映射,将接口和Java的POJOs(Plan Old Java Objects,普通的Java对象)映射成数据库中的记录. orm工具的基本思想 无论是用过的hibernate,mybatis,你都可以法相他们有一个共同点: 1. 从配置文件(通常是XML配置文件中)得到 ses

  • smarty半小时快速上手入门教程

    本文讲述了smarty快速上手入门的方法,可以让读者在半小时内快速掌握smarty的用法.分享给大家供大家参考.具体实现方法如下: 一.smarty的程序设计部分: 在smarty的模板设计部分我简单的把smarty在模板中的一些常用设置做了简单的介绍,这一节主要来介绍一下如何在smarty中开始我们程序设计.下载Smarty文件放到你们站点中. index.php代码如下: 复制代码 代码如下: <?php /** * * @version $Id: index.php * @package

  • 半小时实现Java手撸网络爬虫框架(附完整源码)

    最近在做一个搜索相关的项目,需要爬取网络上的一些链接存储到索引库中,虽然有很多开源的强大的爬虫框架,但本着学习的态度,自己写了一个简单的网络爬虫,以便了解其中的原理.今天,就为小伙伴们分享下这个简单的爬虫程序!! 首先介绍每个类的功能: DownloadPage.java的功能是下载此超链接的页面源代码. FunctionUtils.java 的功能是提供不同的静态方法,包括:页面链接正则表达式匹配,获取URL链接的元素,判断是否创建文件,获取页面的Url并将其转换为规范的Url,截取网页网页源

  • 半小时通透Java的泛型

    目录 前言 学习目标 1. 什么是泛型 2. 为什么需要泛型 3. 如何使用泛型 3.1 泛型使用 3.2 自定义泛型类 3.2.1 Java 源码中泛型的定义 3.2.2 自定义泛型类实例1 3.2.3 自定义泛型类实例2 3.3 自定义泛型方法 4. 泛型类的子类 4.1 明确类型参数变量 4.2 不明确类型参数变量 5. 类型通配符 5.1 无限定通配符 5.2 extends 通配符 5.3 super 通配符 6. 小结 Java 泛型 前言 编程不能停止,每天发一篇~ 不要捉急往后学

  • JavaScript语言精粹经典实例(整理篇)

    数据类型 JavaScript 是 弱类型 语言,但并不是没有类型,JavaScript可以识别下面 7 种不同类型的值: 基本数据类型 1.Boolean 2.Number 3.String 4.null 5.undefined 6.Symbol Object 1.Array 2.RegExp 3.Date 4.Math 5.... 可以使用 typeof 判断数据类型,操作符返回一个字符串,但并非返回的所有结果都符合预期 typeof false // "boolean" type

  • JavaScript 经典实例日常收集整理(常用经典)

    本文是小编日常收集整理些js经典实例,特此分享到我们平台供大家参考! 跨浏览器添加事件 //跨浏览器添加事件 function addEvent(obj,type,fn){ if(obj.addEventListener){ obj.addEventListener(type,fn,false); }else if(obj.attachEvent){//IE obj.attchEvent('on'+type,fn); } } 跨浏览器移除事件 //跨浏览器移除事件 function remove

  • 2019手机号码JS正则表达式验证实例代码

    概念 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑. 简介 正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"))操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串

随机推荐