PHP正则表达式基本函数 修饰符 元字符和需转义字符说明

我在写小偷中用了大量的正则,所以在接下来的版本中要逐步减少正则的应用

在PHP正则表达式中需要转义的字符如下:

$^*()+={}[]|/:<>.?'"

注意:perl风格中表达式要求以/开始和结尾,如:/food/ 表匹配字符 food

perl修饰符如下:

i 完成不区分大小写的搜索
g 查找所有出现(all occurrences,完成全局搜索)
m 将一个字符串视为多行(m就表示多(multiple))。默认情况下,^和$字符匹配字符串中的最开始和最末尾。使用m修饰符将使^和$匹配字符串中每行的开始
s 将一个字符串视为一行,忽略其中的所有换行符;它与m修饰符正好相反
x 忽略正则表达式中的空白和注释
U 第一次匹配后停止。默认情况下,将找到最后一个匹配字符结果。利用这个修饰符可以在第一次匹配后停止。进而形式循环匹配。

元字符说明:

利用Perl正则表达式还可以做另一件有用的事情,这就是使用各种元字符来搜索匹配。元字符(metacharacter)就是一个前面有反斜线的字母字符,表示某种特殊含义。以下是一些有用的元字符。

A 只匹配字符串开头
b 匹配单词边界
B 匹配单词边界之外的任意字符
d 匹配数字字符,它与[0-9]相同
D 匹配非数字字符
s 匹配空白字符
S 匹配非空白字符
[] 包围一个字符类,字符类包括:[0-9] [a-z] [a-zA-Z] 等类似。
() 包围一个字符分组或定义一个反引用
$ 匹配行尾
^ 匹配行首
* 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *
+ 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +
? 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符 ?
. 匹配除换行之外的任何字符
引出下一个元字符
w 匹配任何只包含下划线和字母数字字符的字符串,它与 [a-zA-Z0-9_]相同
W 匹配没有下划线和字母数字字符的字符串

Perl风格函数有:

array preg_grep(string pattern, array input [, flags])
搜索数组中所有元素,返回由与某个模式匹配的所有元素组成的数组
PHP 4.3增加了一个可选参数 flag,它接受一个值 PREG_GREP_INVERT 传递此标志将得到与该模式不匹配的数据元素。

int preg_match(string pattern, string string [, array matches [, int flags [, int offset]]])
在字符串中搜索模式,如果存在返回TRUE,否则返回FALSE。
可选输入参数matches可以包含搜索模式中包含的子模式的各个部分。默认返回 匹配的字符串,当有()子包围时,会在数组后面输出。

int preg_match_all(string pattern, string string, array pattern_array [, int order])
和函数 preg_match一样,不过 preg_match 只搜索一次,而 preg_match_all 会执行循环搜索,返回所有匹配的结果。

mixed preg_replace(mixed pattern, mixed replacement, mixed str [, int limit])
用replacement替换pattern的所有出现,并返回修改后的结果。
可选 limit 指定应当发生多少次匹配。不设置limit或设置为-1将替换所有出现的情况。

以上为常用函数,还有 preg_quote, preg_replace_callbak, preg_split等详细解释略。。。

(0)

相关推荐

  • 正则表达式常用元字符整理小结

    正则表达式元字符和普通字符: 根据正则表达式语法规则,正则表达式的匹配模式是由一系列的字符构成的. 一.普通字符: 大多数的字符仅能够描述它们本身,这些字符称作普通字符,例如所有的字母和数字. 也就是说普通字符只能够匹配字符串中与它们相同的字符. 二.元字符: 由于普通字符只能匹配与自身相同的字符,那么正则表达式的灵活性和强大的匹配功能就不能够完全展现,于是正则表达式中还规定了一系列的特殊字符,这些特殊字符不是按照字符的直接量进行匹配的,而是具有特殊的语义, 例如下面如下字符: ^ $ . *

  • JavaScript学习总结之正则的元字符和一些简单的应用

    一.元字符: 每一个正则表达式都是由元字符和修饰符组成的 [元字符] ->在两个/之间的具有意义的一些字符 reg = /^\d$/  //只能是一个0-9之间的数字   1.具有特殊意义的元字符 \ : 转义字符,转译后面字符所代表的含义 ^ : 以某一个元字符开始 $ : 以某一个元字符结尾 \n : 匹配一个换行符 . : 除了\n以外的任意字符 () : 分组 -> 把一个大正则本身划分成几个小的正则 x|y : x或者y中的一个 [xyz] : x或者y或者z中的一个 [^xyz]

  • 正则表达式\w元字符使用介绍

    正则表达式\w元字符: \w元字符用来匹配单词字符,它等价于"[a-zA-Z0-9]". 语法结构: 构造函数方式: new RegExp("\\w") 对象直接量方式: /\w/ 浏览器支持: IE浏览器支持此元字符. 火狐浏览器支持此元字符. 谷歌浏览器支持此元字符. 实例代码: 实例一: var str="antzone<12>love"; var reg=new RegExp("\\w","g&q

  • 正则表达式(regex)入门、元字符(特殊字符)学习与提高

    什么是正则表达式呢? 正则表达式,又称正规表示法.常规表示法(英语:Regular Expression,在代码中常简写为regex.regexp或RE),它是计算机科学的一个概念.正则表达式使用单个字符串来描述.匹配一系列符合某个句法规则的字符串.几乎在各种计算机编程语言中都有用到.可以分为普通正则表达式.扩展正则表达式.高级正则表达式.普通正则表达式在linux shell中常用到,高级正则表达式语法规范,基本由perl演化而来.目前常见程序语言(php,perl,python,java,c

  • 正则表达式\d元字符(相对于数字0-9)

    正则表达式\d元字符: \d元字符可以匹配数字字符,等价于"[0-9]". 语法结构: 构造函数方式: new RegExp(\\d) 对象直接量方式: /\d/ 浏览器支持: IE浏览器支持此元字符. 火狐浏览器支持此元字符. 谷歌浏览器支持此元字符. 实例代码: 实例一: var str="I love antzone \n and you 360"; var reg=new RegExp("\\d","g"); cons

  • 正则表达式教程之元字符的使用详解

    本文实例讲述了正则表达式教程之元字符的使用.分享给大家供大家参考,具体如下: 注:在所有例子中正则表达式匹配结果包含在源文本中的[和]之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明.所有java例子都在JDK1.6.0_13下测试通过. 一.对特殊字符进行转义 元字符是一些在正则表达式里有着特殊含义的字符.因为元字符在正则表达式里有着特殊的含义,所以这些字符就无法用来代表它们本身.在元字符前面加上一个反斜杠就可以对它进行转义,这样得到的转义序列将匹配那

  • PHP正则表达式基本函数 修饰符 元字符和需转义字符说明

    我在写小偷中用了大量的正则,所以在接下来的版本中要逐步减少正则的应用 在PHP正则表达式中需要转义的字符如下: $^*()+={}[]|/:<>.?'" 注意:perl风格中表达式要求以/开始和结尾,如:/food/ 表匹配字符 food perl修饰符如下: i 完成不区分大小写的搜索 g 查找所有出现(all occurrences,完成全局搜索) m 将一个字符串视为多行(m就表示多(multiple)).默认情况下,^和$字符匹配字符串中的最开始和最末尾.使用m修饰符将使^和

  • 正则表达式m修饰符(多行匹配)

    正则表达式m修饰符: m修饰符规定正则表达式可以执行多行匹配. m修饰符的作用是修改^和$在正则表达式中的作用,让它们分别表示行首和行尾. 在默认状态下,一个字符串无论是否换行只有一个开始^和结尾$,如果采用多行匹配,那么每一个行都有一个^和结尾$. 语法结构: 构造函数方式: new RegExp("regexp","m") 对象直接量方式: /regexp/m 浏览器支持: IE浏览器支持此元字符. 火狐浏览器支持此元字符. 谷歌浏览器支持此元字符. 实例代码:

  • 正则表达式i修饰符(大小写不敏感)

    正则表达式i修饰符: i修饰符用来规定正则表达式的匹配是大小写不敏感的. 语法结构: 构造函数方式: new RegExp("regexp","i") 对象直接量方式: /regexp/i 浏览器支持: IE浏览器支持此元字符. 火狐浏览器支持此元字符. 谷歌浏览器支持此元字符. 实例代码: var str="This is an antzone good"; var reg=/this/; console.log(str.match(reg))

  • 正则表达式u修饰符(支持UTF-16编码)

    正则表达式u修饰符: 此修饰符标识能够正确处理大于\uFFFF的Unicode字符. 也就是说,会正确处理四个字节的UTF-16编码. 此修饰符是ES2015新增,更多正则表达式新特性可以参阅ES2015 正则表达式新增特性一章节. 更多正则表达式教程可以参阅正则表达式教程板块. 代码实例: console.log(/^\uD842/u.test("\uD842\uDFB7")) 输出false,由于"\uD842\uDFB7"是一个四个字节的UTF-16编码,代表

  • 浅谈PHP正则表达式中修饰符/i, /is, /s, /isU

    在学习PHP正则表达式修饰符之前先来理解下贪婪模式,前面在元字符中提到过"?"还有一个重要的作用,即"贪婪模式",什么是"贪婪模式"呢? PHP正则表达式贪婪模式: 比如我们要匹配以字母"a"开头字母"b"结尾的字符串,但是需要匹配的字符串在"a"后面含有很多个"b",比如"a bbbbbbbbbbbbbbbbb",那正则表达式是会匹配第一个&qu

  • 正则表达式模式修饰符

    i (PCRE_CASELESS) 如果设置了这个修饰符,模式中的字母会进行大小写不敏感匹配. m (PCRE_MULTILINE) 默认情况下,PCRE 认为目标字符串是由单行字符组成的(然而实际上它可能会包含多行), "行首"元字符 (^) 仅匹配字符串的开始位置, 而"行末"元字符 ($) 仅匹配字符串末尾, 或者最后的换行符(除非设置了 D 修饰符).这个行为和 perl 相同. 当这个修饰符设置之后,"行首"和"行末"

  • 正则表达式全局匹配模式(g修饰符)

    正则表达式g修饰符: g修饰符用语规定正则表达式执行全局匹配,也就是在找到第一个匹配之后仍然会继续查找. 语法结构: 构造函数方式: new RegExp("regexp","g") 对象直接量方式: /regexp/g 浏览器支持: IE浏览器支持此元字符. 火狐浏览器支持此元字符. 谷歌浏览器支持此元字符. 实例代码: 实例一: var str="this is an antzone good"; var reg=/an/; console.

  • JS正则表达式修饰符global(/g)用法分析

    本文实例讲述了JS正则表达式修饰符global(/g)用法.分享给大家供大家参考,具体如下: /g修饰符代表全局匹配,查找所有匹配而非在找到第一个匹配后停止.先看一段经典代码: var str = "123#abc"; var noglobal = /abc/i;//非全局匹配模式 console.log(re.test(str)); //输出ture console.log(re.test(str)); //输出ture console.log(re.test(str)); //输出

  • JS正则表达式修饰符中multiline(/m)用法分析

    本文实例分析了JS正则表达式修饰符中multiline(/m)用法.分享给大家供大家参考,具体如下: JavaScript正则表达式有3种修饰符/i./m和/g./i是我们最常用,也是最好理解的,代表正则表达式匹配的时候不区分大小写. var regex = /abc/i; alert(regex.test("aBc"));//true /m代表多行模式multiline,如果目标字符串中不含有换行符\n,即只有一行,那么/m修饰符没有任何意义. var multiline = /ab

  • 深入分析c# 封装和访问修饰符

    封装 被定义为"把一个或多个项目封闭在一个物理的或者逻辑的包中".在面向对象程序设计方法论中,封装是为了防止对实现细节的访问. 抽象和封装是面向对象程序设计的相关特性.抽象允许相关信息可视化,封装则使开发者实现所需级别的抽象. C# 封装根据具体的需要,设置使用者的访问权限,并通过 访问修饰符 来实现. 一个 访问修饰符 定义了一个类成员的范围和可见性.C# 支持的访问修饰符如下所示: public:所有对象都可以访问: private:对象本身在对象内部可以访问: protected

随机推荐