半小时精通正则表达式-精华版

虽然我们以前发不过不少的正则表达式教程,但这篇文章还是不错的,无废话都是比较实际的,前提就是需要你之前懂点正则表达式,要不还是先看些基本的正则表达式教程比较好。

-------------------------------------------------------------------------
^ 和 $ 分别用来匹配字符串的开始和结束
-------------------------------------------------------------------------

例1 ^<b> 开头 一定要有"<b>"字符串;
例2 </b>$ 结尾 一定要有"</b>" 的字符串;
例3 ^abc$ 以abc开头和以abc结尾的字符串,实际上是只有abc匹配
例4 abc 没符号就 匹配包含abc的字符串

-------------------------------------------------------------------------
* + 和 ? 用来表示一个字符可以出现的次数或者顺序. 他们分别表示
-------------------------------------------------------------------------

{0,} = * 例1 ab{0,} 匹配以a开头后面B出现O-N次( "a", "ab", "abb", "abbbbbbbbbbbbbbbbb", 无限...)
{1,} = + 例2 ab{1,} 匹配以a开头后面B出现1-N次( "ab", "abb", "abbbbbbbbbbbbbbbbb", 无限...)
{0,1}= ? 例3 ab{0,1} 匹配以a开头后面B出现O-1次( "a", "ab")
   例4 a{0,1}b+$ 匹配以0个或者1个a 再加上一个b结尾的字符串. ( "b", "ab")

注(2种写法)
ab{0,}也可以写成 ab*
ab{1,}也可以写成 ab+
ab{0,1}也可以写成 ab?
a{0,1}b+$也可以写成 a?b+$

(1)1要点, '*' '+',和 '?'只管控制它前面那个字符出现次数.
  2 {N,N} 几到几次 {0} O次
  3{}这个内不能为负数

(2)次数是可以修改的

例5 ab{2} 要求a后面一定要跟两个b(一个也不能少)如 ("abb");
例6 ab{2,} 要求a后面一定要有两个或者两个以上b 如("abb", "abbbb", 等.);
例7 ab{3,5} 要求a后面可以有2-5个b("abbb", "abbbb", or "abbbbb"). 

(3)后面跟多个字符用()
例8 a(bc)* 匹配 a 后面跟0个或者一个"bc"; 当然你也可以写成"a(bc){0,}"
例9 a(bc){1,5} 匹配1个到5个 "bc." 

-------------------------------------------------------------------------
│  相当于OR 用来表示 1个或者 多个或者
-------------------------------------------------------------------------

例1 A│B 匹配含有"A" 或者 "B" 的 字符串;
例2 (A│B)C 匹配含有 "AC" 或者 "BC"的字符串;
例3 (A│B)*C 匹配含有(包括0-1个)a或b,后面跟一个c 

-------------------------------------------------------------------------
.  可以代表所有的单一字符
-------------------------------------------------------------------------
 . 不包括"\n"空格 如果有空格就用 但空格加一字符[\n.] 多个空格+1字符 [\n\n\n\n\n\n.]

例1 a.[0-9] 一个a 加一个字符 再加一个0到9的数字
例2 ^.{3}$ 三个任意字符结尾 

-------------------------------------------------------------------------
'[ab]' 中括号括住的内容只匹配一个单一的字符
-------------------------------------------------------------------------

例1 [ab]   匹配单个的 a 或者 b ( 和 "a│b" 一样);
例2 [a-d]   匹配'a' 到'd'的单个字符 (和"a│b│c│d" 还有 "[abcd]"效果一样); 一般我们都用[a-zA-Z]来指定字符为一个大小写英文
例3 ^[a-zA-Z]  匹配以大小写字母开头的字符串
例4 [0-9]%  匹配含有 形如 x% 的字符串
例5 ,[a-zA-Z0-9]$ 匹配以逗号再加一个数字或字母结尾的字符串
例6 %[^a-zA-Z]% 匹配含有两个百分号里面有一个(非)字母的字符串. 

你也可以把你不想要得字符列在中括号里,你只需要在总括号里面使用'^' 

要点1:^[内容] ^在[]外开头,就表示以内容开头
要点2:[^内容] ^在[]里开头,就表示排除里面的内容(^非的意思)
要点3: 匹配含有这些字符的字符串. 在中括号里[*\+?{}.] 或者' 符号将失效 括号只匹配单一字符
要点4: []中含有']' 最好把它作为列表里的第一个字符(可能跟在'^'后面)
要点5: []中含有有'-' 最好把它放在最前面或者最后面, or 或者一个范围的第二个结束点[a-d-0-9]中间的'-'将有效.

-------------------------------------------------------------------------
\b 和 \B  1匹配一个单词右边界 2匹配非单词边界
-------------------------------------------------------------------------

例1 've\b': 可以匹配love里的ve而不匹配very里有ve
例2 'ov\B': 可以匹配love里的ov而不匹配ovry里有ov

-------------------------------------------------------------------------
\d 和 \D
-------------------------------------------------------------------------

例1 \d 匹配一个数字字符。等价于 [0-9]。
例2 \D 匹配一个非数字字符。等价于 [^0-9]。 

-------------------------------------------------------------------------
\w 和 \W
-------------------------------------------------------------------------
例1 \w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'
例2 \W 匹配包括下划线的任何非单词字符。等价于 '[^A-Za-z0-9_]'。 

-------------------------------------------------------------------------
 匹配非打印字符
-------------------------------------------------------------------------
字符 含义
\cx 匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 'c' 字符。
\f 匹配一个换页符。等价于 \x0c 和 \cL。
\n 匹配一个换行符。等价于 \x0a 和 \cJ。
\r 匹配一个回车符。等价于 \x0d 和 \cM。
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t 匹配一个制表符。等价于 \x09 和 \cI。
\v 匹配一个垂直制表符。等价于 \x0b 和 \cK。 

-------------------------------------------------------------------------
例子
-------------------------------------------------------------------------

匹配首尾空白字符的正则表达式:^s*|s*$
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配网址URL的正则表达式:[a-zA-z]+://[^s]*

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配国内电话号码:d{3}-d{8}|d{4}-d{7} 匹配形式如 0511-4405222 或 021-87888822 920-209 642-964
匹配腾讯qq号:[1-9][0-9]{4,} 1+后面四为的数字开始,也就是 10000
匹配中国邮政编码:[1-9]d{5}(?!d) 中国邮政编码为6位数字
匹配身份证:d{15}|d{18}评注:中国的身份证为15位或18位
匹配ip地址:d+.d+.d+.d+  评注:提取ip地址时有用

-------------------------------------------
^ $ //开始到结尾
+  //连续1-N个 (连在一起的)(也就是-{1,} )
-?  //表示负和非负 (也就是-{0,1} )
[0-9]* //表示前面的位数0-N(也就是[0-9]{0,} )
.?  //表示有点或者无点
[^  //非里面的内容

[a-z] //匹配所有的小写字母
[A-Z] //匹配所有的大写字母
[a-zA-Z] //匹配所有的字母
[0-9] //匹配所有的数字 0-9的整数
[0-9.-] //匹配所有的数字,句号和减号 

------------------------------------------------

^[a-zA-Z0-9_]+$ //所有包含一个以上的字母、数字或下划线的字符串 //举例子连在一起 aA0_A001a_
^[0-9]+$   //所有的正数 (也可以说是非负整数) //举例子 345500687008099900999
^-?[0-9]+$   //所有的整数 (包括 负整数和整数) //举例子 -43443 或者 43443
^-?[0-9]*.?[0-9]*$ //所有的小数 (包括正 副小数 小数点前后的位数无限长) //举例子 -10.00 或者100000.0000
如果没小数点 后面肯定没数字, 所以前面加一个.? 来判断是否有小数点,按道理说可以不需要.?是多余的
因为这个是专门判断小数的,如果没小数点了,还叫付数吗
[^a-z] //除了小写字母以外的所有字符
[^/^] //除了"/"和"^"字符之外的所有字符
[^"'] //除了双引号(")和单引号(')之外的所有字符
(0)

相关推荐

  • php半小时精通正则表达式

    想必很多人都对正则表达式都头疼.今天,我以我的认识,加上网上一些文章,希望用常人都可以理解的表达方式.来和大家分享学习经验. 开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明: "^The":开头一定要有"The"字符串: "of despair$":结尾一定要有"of despair" 的字符串: 那么, "^abc$":就是要求以abc开头和以abc结尾的字符串,实际

  • 半小时精通正则表达式 经典实例介绍

    开篇,还是得说说 ^ 和 $ 他们是分别用来匹配字符串的开始和结束,以下分别举例说明 如果您是新手,猜你取消 正则表达式30分钟入门教程"^The": 开头一定要有"The"字符串; "of despair$": 结尾一定要有"of despair" 的字符串; 那么, "^abc$": 就是要求以abc开头和以abc结尾的字符串,实际上是只有abc匹配 "notice": 匹配包含no

  • 半小时精通正则表达式-精华版

    虽然我们以前发不过不少的正则表达式教程,但这篇文章还是不错的,无废话都是比较实际的,前提就是需要你之前懂点正则表达式,要不还是先看些基本的正则表达式教程比较好. ------------------------------------------------------------------------- ^ 和 $ 分别用来匹配字符串的开始和结束 -------------------------------------------------------------------------

  • 半小时实现Java手撸网络爬虫框架(附完整源码)

    最近在做一个搜索相关的项目,需要爬取网络上的一些链接存储到索引库中,虽然有很多开源的强大的爬虫框架,但本着学习的态度,自己写了一个简单的网络爬虫,以便了解其中的原理.今天,就为小伙伴们分享下这个简单的爬虫程序!! 首先介绍每个类的功能: DownloadPage.java的功能是下载此超链接的页面源代码. FunctionUtils.java 的功能是提供不同的静态方法,包括:页面链接正则表达式匹配,获取URL链接的元素,判断是否创建文件,获取页面的Url并将其转换为规范的Url,截取网页网页源

  • ReactJs快速入门教程(精华版)

    现在最热门的前端框架有AngularJS.React.Bootstrap等.自从接触了ReactJS,ReactJs的虚拟DOM(Virtual DOM)和组件化的开发深深的吸引了我,下面来跟我一起领略ReactJs的风采吧~~ 文章有点长,耐心读完,你会有很大收获哦~   一.ReactJS简介 React 起源于 Facebook 的内部项目,因为该公司对市场上所有 JavaScript MVC 框架,都不满意,就决定自己写一套,用来架设 Instagram 的网站.做出来以后,发现这套东西

  • smarty半小时快速上手入门教程

    本文讲述了smarty快速上手入门的方法,可以让读者在半小时内快速掌握smarty的用法.分享给大家供大家参考.具体实现方法如下: 一.smarty的程序设计部分: 在smarty的模板设计部分我简单的把smarty在模板中的一些常用设置做了简单的介绍,这一节主要来介绍一下如何在smarty中开始我们程序设计.下载Smarty文件放到你们站点中. index.php代码如下: 复制代码 代码如下: <?php /** * * @version $Id: index.php * @package

  • mysql每半小时平均值计算的sql语句

    表结构: CREATE TABLE `instance` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `timestamp` int(10) unsigned DEFAULT NULL, `cpu` decimal(8,3) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGINE=InnoDB; 统计每半小时平均值,实现可以如下: select `timestamp`-`timestamp`% (5*60) , a

  • ASCII码对照表以及各个字符的解释(精华版)

    ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是一套基于拉丁字母的字符编码,共收录了 128 个字符,用一个字节就可以存储,它等同于国际标准 ISO/IEC 646. ASCII 规范于 1967 年第一次发布,最后一次更新是在 1986 年,它包含了 33 个控制字符(具有某些特殊功能但是无法显示的字符)和 95 个可显示字符. ASCII 码对照表 二进制 十进制 十六进制 缩写/字符 解释 00000

  • 一看就懂的ReactJs基础入门教程-精华版

    一.ReactJS简介 React 起源于 Facebook 的内部项目,因为该公司对市场上所有 JavaScript MVC 框架,都不满意,就决定自己写一套,用来架设 Instagram 的网站.做出来以后,发现这套东西很好用,就在2013年5月开源了.由于 React 的设计思想极其独特,属于革命性创新,性能出众,代码逻辑却非常简单.所以,越来越多的人开始关注和使用,认为它可能是将来 Web 开发的主流工具. ReactJS官网地址:http://facebook.github.io/re

  • OpenCV半小时掌握基本操作之边缘检测

    目录 概述 Scharr 算子 Laplacian 算子 Sobel vs Scharr vs Laplacian Canny 边缘检测 高斯滤波器 梯度和方向 非极大值抑制 双阈值检测 [OpenCV]⚠️高手勿入! 半小时学会基本操作⚠️ 边缘检测 概述 OpenCV 是一个跨平台的计算机视觉库, 支持多语言, 功能强大. 今天小白就带大家一起携手走进 OpenCV 的世界. (第 12 课) Scharr 算子 Scharr 算子和 Sobel 算子基本一样. 只是卷积核系数不同. Sch

随机推荐