JavaScript 核心参考教程 RegExp对象

  1. 正则表达式的直接量字符
    字符 匹配
    字母数字字符 本身
    \o NUL字符(\u0000)
    \t 制位表(\u0009)
    \n 换行符(\u000A)
    \v 垂直制位表(\u000B)
    \f 换页符(\u000C)
    \r 回车(\u000D)
    \xnn 由十六进制数nn指定的拉丁字符,例如\u0A等价于\n
    \uxxxx 由十六进制数xxxx指定的Unicode字符,例如\u0009等价于\t
    \cX 控制字符X,例如,\cJ等价于\n
  2. 正则表达式的字符类
    字符 匹配
    [...] 位于括号内的任意字符
    [^...] 不在括号之中的任意字符
    . 除换行符和其他Unicode行中止符之外的任意字符
    \w 任何ASCII单字字符,等价于[a-zA-Z0-9_]
    \W 任何ASCII非单字字符,等价于[^a-zA-Z0-9_]
    \s 任何Unicode空白符[\f\n\r\t\v]
    \S 任何Unicode非空白符,注意\w和\S的不同[^\f\n\r\t\v]
    \d 任何ASCII数字,等价于[0-9]
    \D 除了ASCII数字之外的任何字符,等价于[^0-9]
    [\b] 退格直接量(特例)
  3. 正则表达式的重复字符
    字符 含义
    {n,m} 匹配前一项至少n次,但不能超过m次
    {n,} 匹配前一项n次,或更多次
    {n} 匹配前一项恰好n次
    ? 匹配前一项0次或1次,也就是说这一项是可选的。等价于{0,1}
    + 匹配前一项1次或多次。等价于{1,}
    * 匹配前一项0次或多次。等价于{0,}
    在正则表达式中,括号具有几种作用。一个作用是把单独的项目组合成子表达式,以便可以象处理一个
    独立的单元那样用|、*、+或?等来处理它们。括号的另一个作用是在完整的模式中定义子模式。当一
    个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配的部分。
  4. 正则表达式的选择、分组和引用字符
    字符 含义
    | 选择。匹配的是该符号的左边的子表达式或右边的子表达式
    (...) 组合。将几个项目组合为一个单元,这个单元可由|、*、+或?等符号使用,
    而且还可以记住和这个组合匹配的字符,以供此后的引用使用
    (?:...) 只组合。把项目组合到一个单元,但是不记忆与该组匹配的字符
    \n 和第n个分组第一次匹配的字符相匹配,组是括号中的子表达式(可能是嵌套
    的)。组号是从左到右计数的左括号数,以(?:形式分组的组不编码。
  5. 正则表达式的锚元素
    字符 含义
    ^ 匹配字符串的开头,在多行检索中,匹配一行的开头
    $ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
    \b 匹配一个词语的边界。简而言之,就是位于字符\w和\W之间的位置,或位于字符\w
    和字符串的开头和结尾的位置(但注意:[\b]匹配的是退格符)
    \B 匹配非词语边界的字符
    (?=p) 正前向声明,要求接下来的字符都与模式p匹配,但是不包括匹配中的那些字符
    (?!p) 反向前声明,要求接下来的字符不与模式P匹配
  6. 正则表达式的标志
    字符 含义
    i 执行大小写不敏感匹配
    g 执行一个全局匹配,简而言之,即找到所有匹配,而不是找到第一个之后就停止
    m 多行模式,^匹配一行的开头和字符串的开头,$匹配一行的结尾和字符串的结尾


JS中的RegExp对象

  1. 构造函数:

    显式构造函数,语法为:new RegExp("pattern"[,"flags"])。
    隐式构造函数,语法为: /pattern/[flags]。

  2. 静态属性























    index 是当前表达式模式首次匹配内容的开始位置,从0开始计数。其初始值为-1,每次成功匹配时,index属性都会随之改变。
    input 返回当前所作用的字符串,可以简写为$_,初始值为空字符串""。
    lastIndex 是当前表达式模式首次匹配内容中最后一个字符的下一个位置,从0开始计数,常被作为继续搜索时的起始位置,初始值为-1,表示从起始位置开始搜索,每次成功匹配时,lastIndex属性值都会随之改变。
    lastMatch 是当前表达式模式的最后一个匹配字符串,可以简写为$&。其初始值为空字符串""。在每次成功匹配时,lastMatch属性值都会随之改变。
    lastParen 如果表达式模式中有括起来的子匹配,是当前表达式模式中最后的子匹配所匹配到的子字符串,可以简写为$+。其初始值为空字符串""。每次成功匹配时,lastParen属性值都会随之改变。
    leftContext 是当前表达式模式最后一个匹配字符串左边的所有内容,可以简写为$`(其中“'”为键盘上“Esc”下边的反单引号)。初始值为空字符串""。每次成功匹配时,其属性值都会随之改变。
    $1…$9 这些属性是只读的。如果表达式模式中有括起来的子匹配,$1…$9属性值分别是第1个到第9个子匹配所捕获到的内容。如果有超过9个以上的子匹配,$1…$9属性分别对应最后的9个子匹配。在一个表达式模式中,可以指定任意多个带括号的子匹配,但RegExp对象只能存储最后的9个子匹配的结果。在RegExp实例对象的一些方法所返回的结果数组中,可以获得所有圆括号内的子匹配结果。

  3. 实例属性














    global 返回创建RegExp对象实例时指定的global标志(g)的状态。如果创建RegExp对象实例时设置了g标志,该属性返回True,否则返回False,默认值为False。
    ignoreCase 返回创建RegExp对象实例时指定的ignoreCase标志(i)的状态。如果创建RegExp对象实例时设置了i标志,该属性返回True,否则返回False,默认值为False。
    multiLine 返回创建RegExp对象实例时指定的multiLine标志(m)的状态。如果创建RegExp对象实例时设置了m标志,该属性返回True,否则返回False,默认值为False。
    source 返回创建RegExp对象实例时指定的表达式文本字符串。

  4. 实例方法











    exec 语法格式为exec(str)。该方法使用创建RegExp对象实例时所指定的表达式模式对一个字符串进行搜索,并返回一个包含搜索结果的数组。
    如果为正则表达式设置了全局标志(g),可以通过多次调用exec和test方法在字符串中进行连续搜索,每次都是从RegExp对象的lastIndex属性值指定的位置开始搜索字符串。
    如果没有设置全局标志(g),则exec和test方法忽略RegExp对象的lastIndex属性值,从字符串的起始位置开始搜索。如果exec方法没有找到匹配,返回值为null;如果找到匹配,则返回一个数组,并更新RegExp对象中有关静态属性以反映匹配情况。返回数组中的元素0包含了完整的匹配结果,而元素1~n依次是表达式模式中定义的各个子匹配的结果。
    test 语法格式为test(str)。该方法检查一个字符串中是否存在创建RegExp对象实例时所指定的表达式模式,如果存在就返回True,否则返回False。 如果找到匹配项,则会更新RegExp对象中的有关静态属性,以反映匹配情况。
    compile 语法格式为compile("pattern"[,"flags"])。该方法可以更换RegExp对象实例所使用的表达式模式,并将新的表达式模式编译为内部格式,从而使以后的匹配过程执行更快。

  5. RegExp说明

    默认情况下,正则表达式使用最长(也叫贪婪)匹配原则.当?紧随其它限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式变成使用最短(也叫非贪婪)匹配原则.

    分组组合符就是将正则表达式中的某一部分内容组合起来的符号,反向引用符则是用于匹配前面的分组组合所捕获到的内容标识符号
    (1) (pattern)将圆括号中的pattern部分组合成一个可统一操作的组合项和子匹配,每个捕获
    的子匹配项按照它们在正则表达式模式中从左到右出现的顺序存储在缓冲区中.缓冲区从1开始编号,最多可存储99个子匹配捕获的内容.存储在缓冲区中的子匹配捕获的内容,可以在编程语言中被检索,也可以在正则表达式中被反向引用.若要匹配字面意义的括号字符"("和")",在正则表达式中要分别使用"\(" 和"\)".
    (2) \num匹配编号为num的缓冲区所保存的内容,此处的num是一个标识特定缓冲区的一位或两位十进制正整数,这种方式称为子匹配的反向引用.反向引用最有用的应用之一就是能提供表示相同匹配项的能力,例如,要匹配连续的5个数字字符,可以使用\d{5}作为正则表达式文本,它可以匹配12345,但是, 要匹配连续的5个相同的数字字符,如55555、11111等,需要使用(\d)\1{4}作为正则表达式文本,\1表示与前面(\d)所捕获的内容一样,\1{4}则表示前面的(\d)所捕获的内容还连续出现4次.又例如,要匹配"Is is the cost of of gasoline going up up?"中所有连续重复的单词部分,可以使用/\b([a-z]+)\1\b/gi作为正则表达式文本.
    (3) (?:pattern) 将圆括号中的pattern部分组合成一个可统一操作的组合项,但不把这部分内容当作子匹配捕获,即pattern部分是一个非捕获匹配,它匹配的内容不存储在缓冲区中供以后使用.这对必须进行组合、但又不想让组合的部分具有子匹配特点的情况很有用.
    (4) (?=pattern)称为正向"预测先行"匹配,在被搜索字符串的相应位置必须有pattern部分匹配的内容,但这部分匹配的内容不作为匹配结果处理,更不会被存储在捕获缓冲区中供以后使用.(?=pattern)必须位于一个正则表达式模式的最前或最后面.
    (5) (?!pattern)称为反向"预测先行"匹配,在被搜索的字符串的相应位置不能有pattern部分匹配的内容,除此之外,功能与正向"预测先行"匹配一样.


实例演示
* 简单示例

[Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

# 注意事项
(?<=exp)零宽度正回顾后发断言(不支持)
(?<!exp)零宽度负回顾后发断言(不支持)
# 参考资料
正则表达式30分钟入门教程 http://www.jb51.net/tools/zhengze.html

(0)

相关推荐

  • 详解JavaScript RegExp对象

    什么是 RegExp? 正则表达式描述了字符的模式对象. 当您检索某个文本时,可以使用一种模式来描述要检索的内容.RegExp 就是这种模式. 简单的模式可以是一个单独的字符. 更复杂的模式包括了更多的字符,并可用于解析.格式检查.替换等等. 您可以规定字符串中的检索位置,以及要检索的字符类型,等等. RegExp对象是原生JavaScript中表示正则表达式的对象. 创建对象的方法为:var RegExp = new RegExp(pattern, attributes); 参数pattern

  • javascript正则表达式和字符串RegExp and String(一)

    前言 正则表达式是javascript非常重要和常用的功能,在jquery等大型框架中用的非常频繁,最近抽时间学习了解了相关知识,记录下来与需要的朋友分享. 思维导图 RegExp(正则表达式)的创建方式 可以通过两种方式创建一个RegExp,具体如下: 通过/-./的方式来创建正则表达式(注意: /--/两边是没有单引号或双引号的) 通过RegExp构造方法来创建一正则表达式 为了更好的描述模式,正则表达式提供了3个标识,分别是: g/i/m g: 全局匹配:在整个字符串中匹配,而不是在第一次

  • javascript RegExp对象(正则表达式)

    使用RegExp的显式构造函数,语法为:new RegExp("pattern"[,"flags"]). 使用RegExp的隐式构造函数,采用纯文本格式:/pattern/[flags]. pattern部分为要使用的正则表达式模式文本,是必须的.在第一种方式中,pattern部分以JavaScript字符串的形式存在,需要使用双引号或单引号括起来:在第二种方式中,pattern部分嵌套在两个"/"之间,不能使用引号. flags部分设置正则表达

  • JS正则中的RegExp对象对象

    有两种方式可以创建RegExp对象的实例. 使用RegExp的显式构造函数,语法为:new RegExp("pattern"[,"flags"]). 使用RegExp的隐式构造函数,采用纯文本格式:/pattern/[flags]. pattern部分为要使用的正则表达式模式文本,是必须的.在第一种方式中,pattern部分以JavaScript字符串的形式存在,需要使用双引号或单引号括起来:在第二种方式中,pattern部分嵌套在两个"/"之间

  • javascript 正则替换 replace(regExp, function)用法

    复制代码 代码如下: function fn() { for(var i = 0;i < arguments.length;i++){ alert("第"+(i+1)+"个参数的值:"+arguments[i]); } } var str = '<div id="{wo}" >{ni}</div>'; str.replace(/\{([a-z]+)\}/ig, fn); 根据多次测试由输出结果可以得出fn中: 第一个

  • JavaScript学习小结(7)之JS RegExp

    在js中,正则表达式是由一个RegExp对象表示的,RegExp 是正则表达式的缩写.RegExp简单的模式可以是一个单独的字符.更复杂的模式包括了更多的字符,并可用于解析.格式检查.替换等等.可以使用一个RegExp()构造函数来创建RegExp对象,也可以使用直接量语法. 1.RegExp简介. RegExp即正则表达式(Regular Expression,在代码中常简写为regex.regexp或RE/re/reg),就是使用单个字符串来描述.匹配一系列符合某个句法规则的字符串搜索模式,

  • JavaScript通过RegExp实现客户端验证处理程序

    1.让文本框只允许输入数字,运用asp.net mvc3.0的文本框控件 复制代码 代码如下: @Html.TextBox("txt",null, new {@style="width:300;",onkeypress="return RegValidateIsDigit(event)" }) 可以看到在文本框中注册了onkeypress事件,当在文本框中输入一个字符按下键盘的时候就会触发该JavaScript的函数 复制代码 代码如下: <

  • javascript 中String.match()与RegExp.exec()的区别说明

    1. 这两个方法,如果匹配成功,返回一个数组,匹配失败,返回null. 2. 当RegExp的global属性为false时,这两个方法的返回数组是一样的. 数组的第0个元素是整个pattern的第一个匹配字符串,接下来的元素是pattern第一个匹配中的子匹配字符串. 此外,数组还有index和input两个额外属性,index是匹配字符串的起始位置,input是整个输入字符串. 此时,RegExp的lastIndex属性一直是0. demo: 复制代码 代码如下: var s = 'this

  • javascript正则表达式和字符串RegExp and String(二)

    在上篇文章给大家介绍了javascript正则表达式和字符串RegExp and String(一),本文给大家继续分享相关内容. 前言 我认为,在学习一门编程语言的过程中,字符串.数组.容器是非常重要的部分,为了提高编程效率,我通常会对字符串.数组以及容器作深入的学习,详细了解相关特点及对应的API.这篇文章是针对javascript字符串学习写下的笔记,在此与需要的朋友分享. 思维导图 字符串的创建方式 字符串是javascript中的基本类型之一,它对应的类型是String,可以通过两种方

  • javascript RegExp multiline多行匹配影响的^$

    内容全写注释里了- - 复制代码 代码如下: <script type="text/javascript"> /^$/.test('\n'); //false,为什么呢,说明如下 var p = /^/mg; var s = '1\n\n\n2\n\n3'; p.test(s); //跳过开始位置JS里好象没那个词- - p.test(s); alert(RegExp.rightContext.replace(/\x0A/g, '\\a')); //由此得出^匹配的是\n后

  • 正则(JS)re=new RegExp("^\\d*$");与re=/^\d*$/;之间区别?

    以下代码结果为:FALSE,TRUE,TRUE      请问结果中为什么第一个为FALSE?      <form   name=form1>      字符串:<input   name="t1"   value="123456">      模式:/<input   name="t2"   value="^\d*$">/      </form>      <scri

  • js正则表达式讲解之index属性(RegExp对象)

    功能:index与search返回的值相同,不管是是否匹配到合适内容,如果找到合适内容则index为匹配内容其实字符的起始位置,如果没有找到则返回-1 基本语法RegExp.index 注意:该属性也是RegExp的静态属性,调用方式固定. 复制代码 代码如下: <html> <script language="javascript" type="text/javascript"> //alert('Designed By Androidyu

随机推荐