php 正则表达式学习笔记

代码如下:

//匹配文本,这个偶尔比较好用,但是要小心字符中包含\E 
$str = '[a-z]'; 
$str = preg_replace('/\G[a-z]\E/', '', $str); 
echo $str; //打印空,全被替换掉了,相关大概就是preg_quote功能 
复制内容到剪贴板代码: 
//给匹配结果命名,这样在匹配结果中就可以用这个名称来获取值 
$str = 'abc123abc'; 
preg_match('/(?P<num>\d+)/', $str, $arr); 
echo $arr['num']; //相当于echo $arr[1]

代码如下:

//仅用于分组的括号,匹配内容不会被变量捕获,有时候需要这样提高执行效率 
$str = 'abc123abc'; 
preg_match('/abc(?:\d+)/', $str, $arr); 
echo $arr[1]; //除了$arr[0]外没有$arr[1]了,不会赋予\1

代码如下:

//插入的好帮手,向前、向后锚点搜索位置,每3位添加一个逗号 
$str = 'fdfad123456789fdfd'; 
$str = preg_replace('/(?<=\d)(?=(\d{3})+(?!\d))/', ',', $str); 
echo $str; //打印 fdfad123,456,789fdfd

//以最少的结果匹配
$str = 123456;
preg_match('/\d+/', $str, $arr);
echo $arr[0]; //是人都知道是123456吧
preg_match('/\d+?/', $str, $arr);
echo $arr[0]; //这次是1
//一个比较有用的,可以判断前面的是否有匹配过,比如下边的例子,可以忽略等号右边是否有单引号双引号或者什么都没有
$str = <<<HTML
<font size=12></font>
<font size='13'></font>
<font size="14"></font>
<font size="15></font>
HTML;
preg_match_all('/<font\s+size=([\'"]?)(\d+)\1[^>]*>/', $str, $arr);
print_r($arr);
/*
Array
(
    [0] => 12
    [1] => 13
    [2] => 14
)
*/
//部分模式修饰符,模式修饰符也可以放在表达式中的
//这里匹配符合XHTML规范的style里的颜色值,大写的STYLE被忽略了,但是里面的color可以大小写无所谓
$str = '<b style="COLOR:red"></b><b STYLE="color:blue"></b><b style="color:green"></b>';
preg_match_all('/style=([\'"]?)(?i)color:(\w+)\1(?-i)/', $str, $arr);
print_r($arr[2])
//也可以把匹配内容放到里面,用:隔开,就不用写结束(?-i)
//preg_match_all('/style=([\'"]?)(?i:color:(\w+))\1/', $str, $arr);
//再看一例子
$str = '<B>Style</B>';
preg_match('/<B>(?i:style)<\/B>/', $str, $arr);
print_r($arr); //可以匹配到
$str = '<B>Style</b>';
preg_match('/<B>(?i:style)<\/B>/', $str, $arr);
print_r($arr); //什么都没匹配到
//单词检索,可惜只能用在英文
$str = 'I\'m a teacher';
preg_match_all('/\b[a-z]+\b/i', $str, $arr);
print_r($arr)
复制内容到剪贴板代码:
//u修饰符,按unicode匹配
$str = '你您';
$str = preg_replace('/[你您]/', 'you', $str);
echo $str; //被拆开了,打印4次you
//看下面加上u修饰符后的效果,该修饰符需要编码utf-8否则会报错
//我的文本都是gb2312,所以要转成utf-8
$str = iconv('gb2312', 'utf-8', '你您');
$regex = iconv('gb2312', 'utf-8', '/[你您]/u');
$str = preg_replace($regex, 'you', $str);
echo $str; //打印2次you
//x模式修饰符,可以忽略空白和加注释
$str = 'test Test';
preg_match('/test  #只匹配小写的test/x', $str, $arr);
print_r($arr);
复制内容到剪贴板代码:
//排除环视(?<!...) (?!...)、忽略优先 *? +? ?? 的复合使用
$str = 'test <B>test1<B> test2</B>';
preg_match('/<B>(?:.(?<!<B>))*<\/B>/i', $str, $arr);
//或者 preg_match('/<B>(?:(?!<B>).)*<\/B>/i', $str, $arr);
print_r($arr)
//当时这样写应付不了 $str = 'test <B>test1<B> test2</B> test3</B>';
//改写一下正则既可 preg_match_all('/<B>(?:(?!<\/?B>).)*<\/B>/i', $str, $arr);
//根据上面来完成一个最简单的UBB替换
$str = 'test [b]test1[b] test2[/b] test3[/b]test';
$str = preg_replace('/\[B\]((?:(?!\[\/?B\]).)*)\[\/B\]/i', '<b>\1</b>', $str);
$str = preg_replace('/\[B\]((?:(?!\[\/?B\]).)*)\[\/B\]/i', '<b>\1</b>', $str);
print_r($str)
//如果已经确认回朔并不会有匹配结果,可以使用固化分组来放弃备用状态提高效率
$str = 'Subject';
preg_match('/(\w+):/', $str, $arr);
//用以下方法代替
//在第一组匹配规则匹配到文本末尾t时匹配结束,启用第二组匹配规则:并不会找到结果,所以这个时候回朔查找,但是\w不会包含:,所以可以直接放弃,
preg_match('/(?>\w+):/', $str, $arr);

(0)

相关推荐

  • Python模块学习 re 正则表达式

    re.match re.match 尝试从字符串的开始匹配一个模式,如:下面的例子匹配第一个单词. 复制代码 代码如下: import re text = "JGood is a handsome boy, he is cool, clever, and so on..." m = re.match(r"(\w+)\s", text) if m: print m.group(0), '\n', m.group(1) else: print 'not match' r

  • js 正则表达式学习笔记之匹配字符串

    今天看了第5章几个例子,有点收获,记录下来当作回顾也当作分享. 关于匹配字符串问题,有很多种类型,今天讨论 js 代码里的字符串匹配.(因为我想学完之后写个语法高亮练手,所以用js代码当作例子) 复制代码 代码如下: var str1 = "我是字符串1哦,快把我取走", str2 = "我是字符串2哦,快把我取走"; 比如这样一个字符串,匹配起来很简单 /"[^"]*"/g 即可.   PS: 白色截图是 chrome 34 控制台中

  • 重温JavaScript中的正则表达式 js学习笔记

    一.创建正则表达式 创建正则表达式和创建字符串类似 , 创建正则表达式提供了两种方法 , 一种是采用 new运算符,另一个是采用字面量方式. 复制代码 代码如下: var dog = new RegExp('dog'); // 第一个参数字符串 var dog = new RegExp('dog', 'ig'); // 第二个参数可选模式修饰符 var dog = /dog/; var dog = /dog/ig; //字面量方式. RegExp 对象包含两个方法 : test() 和 exec

  • MySql官方手册学习笔记2 MySql的模糊查询和正则表达式

    SQL模式匹配允许你使用"_"匹配任何单个字符,而"%"匹配任意数目字符(包括零字符).在 MySQL中,SQL的模式默认是忽略大小写的.下面给出一些例子.注意使用SQL模式时,不能使用=或!=:而应使用LIKE或NOT LIKE比较操作符. 要想找出以"b"开头的名字: mysql> SELECT * FROM pet WHERE name LIKE 'b%';+--------+--------+---------+------+---

  • javascript的正则表达式学习资料复习

    关于反向引用 复制代码 代码如下: // 测试函数 function matchReg(reg, str) { var result = str.match(reg); if(result) { console.dir(result); } else { console.log('match failed'); } } var reg = /([A-Za-z]{0,6})\1/; var str = 'AndrewAndrew'; // 测试通过 matchReg(reg, str); //通过

  • 正则表达式详细介绍(上)

    本文是Jan Goyvaerts为RegexBuddy写的教程的译文,下面来看吧! 1. 什么是正则表达式 基本说来,正则表达式是一种用来描述一定数量文本的模式.Regex代表Regular Express.本文将用<<regex>>来表示一段具体的正则表达式. 一段文本就是最基本的模式,简单的匹配相同的文本. 2. 不同的正则表达式引擎 正则表达式引擎是一种可以处理正则表达式的软件.通常,引擎是更大的应用程序的一部分.在软件世界,不同的正则表达式并不互相兼容.本教程会集中讨论Pe

  • Powershell学习笔记--使用正则表达式查找文件

    支持所有PS版本 Get-ChildItem 不支持文件高级筛选.它只能使用简单的通配符,但不能使用正则表达式. 围绕这个问题,我们可以使用-match命令来筛选. 下面这个例子将获得所有windows目录下包含至少连续有两个数字的文件同时文件名长度不超过8个字符: Get-ChildItem -Path $env:windir -Recurse -ErrorAction SilentlyContinue | Where-Object { $_.BaseName -match '\d{2}' -

  • 正则表达式 学习参考 推荐入门者看

    1       概述 正则表达式(Regular Expression)是一种匹配模式,描述的是一串文本的特征. 正如自然语言中"高大"."坚固"等词语抽象出来描述事物特征一样,正则表达式就是字符的高度抽象,用来描述字符串的特征. 正则表达式(以下简称正则,Regex)通常不独立存在,各种编程语言和工具作为宿主语言提供对正则的支持,并根据自身语言的特点,进行一定的剪裁或扩展. 正则入门很容易,有限的语法规则很容易掌握,但是目前正则的普及率并不高,主要是因为正则的流派

  • 正则表达式口诀 正则表达式学习工具

    签于网上太多的介绍都是一篇凶悍的短文,边看边理解可以,帮助记忆不行.又受五笔字型字根表口诀"白手看头三二斤..."的启发,  试作"正则表达式助记口诀"又名"正则打油诗",版本0.1,绝对原创,仿冒必究,:)  注:本文仅为学习正则时为了便于记忆而作,不能代替系统而全面的学习过程,错漏之处,敬请指正!  正则其实也势利,削尖头来把钱揣: (指开始符号^和结尾符号$)  特殊符号认不了,弄个倒杠来引路: (指\. \*等特殊符号)  倒杠后面跟小w

  • 正则表达式口诀_学习正则的朋友值得一看

    签于网上太多的介绍都是一篇凶悍的短文,边看边理解可以,帮助记忆不行.又受五笔字型字根表口诀"白手看头三二斤..."的启发, 试作"正则表达式助记口诀"又名"正则打油诗",版本0.1,绝对原创,仿冒必究,:) 注:本文仅为学习正则时为了便于记忆而作,不能代替系统而全面的学习过程,错漏之处,敬请指正! 正则其实也势利,削尖头来把钱揣:  (指开始符号^和结尾符号$) 特殊符号认不了,弄个倒杠来引路:  (指\. \*等特殊符号) 倒杠后面跟小w, 数

  • 正则表达式 学习资料整理

    常用正则表达式 整理篇http://www.jb51.net/article/17355.htm 正则表达式高级学习技巧http://www.jb51.net/article/9229.htm 1.正则表达式简介 正则表达式(Regular expression,简写为Regexes)是一种用来操作和检验字符串数据的强大工具.它相当与一串特殊的字符,用它可以转换成算法,对文本进行匹配等操作. 事实上正则表达式有其自身的一套语法,这种语法对于初学者来说显得有些晦涩难懂.尤其是其构造比较困难,称为很

  • Java 正则表达式学习总结和一些小例子

    从Java1.4起,Java核心API就引入了java.util.regex程序包,它是一种有价值的基础工具,可以用于很多类型的文本处理, 如匹配,搜索,提取和分析结构化内容. java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher. Pattern是一个正则表达式经编译后的表现模式. 在java中,通过适当命名的Pattern类可以容易确定String是否匹配某种模式.模式可以象匹配某个特定的String那样简单

  • JS 正则表达式(学习笔记2)匹配网址url参数

    . 匹配除换行符的任意字符 \w 匹配字母,数字,下划线,汉字 \s 匹配任意空白符 \d 匹配数字 ^ 匹配字符开始位置 $ 匹配字符结束位置 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复N次 {n,} 重复N次或更多次 {n,m} 重复N次或m次url参数匹配的问题 var str="http://ladjkfldfjlfjlafjlfk/-1-1.html?sdlfjsdlkfjsdlfjo";//这是一个url //要求把URL里面-1.html

  • 正则表达式学习问答

    举个简单的例子吧,Unix下的usr.dev等名字,就是那时留传下来的,现在已经有很多人诟病了,usr不是user,dev不是device,难学,也难记.经过这些年的飞速发展,当年的很多问题已经被包装得美轮美奂,如今的用户可能更习惯直接点击"用户目录"."驱动器"之类的图标,再也不用为那些不规则的简短名字发愁.但是不幸的是,一直以来正则表达式的语法却没有太多的变化,甚至后续增加的功能,也沿袭了之前的语法风格,在编程语言日渐人性化的今天,它自然显得非常难懂了.今天的开

随机推荐