浏览器中的正则表达式陷阱说明

在本章开始前 我要引入一个例子 来说明这种不彻底的 变态的优化 到底合理还是不合理...

c# 中的 字符串直接量 做的优化 就非常彻底...这种优化我们应该是欢迎的...

string str="franky";

string str2="franky";

在内存中 只有一份 字符串对象 而str和str2 具备相同的一份引用. 很明显 这非常合理.

string n = "franky",  n2 = "franky";
Response.Write((Object.ReferenceEquals(n,n2)).ToString());//True.

那么 一些特殊情况下  有些浏览器 为正则表达式直接量也做了类似的优化.

alert(/\d/==/\d/);//所有浏览器都是false 这很合理 因为正则表达式直接量 同 [] 数组直接量 {}对象直接量一样 都是引用类型

我们再看看哪些情况下哪些浏览器做了优化

function f2() {
        return /\d/;
    }

alert(f2() == f2());

//这里的结果就有不同了

ie6 7 8  opear10 safari4 都返回false  (我虚拟机里safari3坏了没做测试.如果谁有 帮忙测下告诉我结果.谢谢 我估计safari3 会返回true.原因是 maxthon3用的引擎貌似就是safari3 的)

但是

firefox 2.0 3.0+ 3.5 3.6  chrome 4 5 opear9  maxthon3 demo版  使用webkit引擎下 都返回true

有趣的地方在于 opera9 做了优化 而opera10 取消了这种优化. 看来至少opera团队认为这种优化时不恰当的...(变相支持了我的观点.)

看到这里 你也许会奇怪 是不是 bug而不是所谓优化啊? 也许是闭包对象 出了什么问题或者 是 函数对象上的某些bug引起的?

那么我们看看下面的例子:

for (var i = 0; i < 10; i++) document.writeln(/\d/g.test('' + i));

不同浏览器 输出结果的 差异 完全符合上面 是否做优化的分类.

即没有 做优化的浏览器 一律返回true 而作了优化的浏览器 则是 true false true false 交替的结果.

我们这里只是一个 循环 ..js中的循环没有独立的作用域 更不会产生闭包对象 那么可以肯定 引起这个怪异问题的 根本原因就是某些浏览器自作聪明的优化.

可能大家不太理解 test的结果 差异来自哪里...  答案是 test 同 exec 一样 如果 直接量后面有/g  .设置了 global全局查找参数 的话 那么 同一个test对象 会记录上次 匹配字符的索引位置.下次再 匹配时 会从这个位置开始..如果没有 则 匹配索引<0 下次在此匹配时 就仍然从0位置字符开始.

所以上面这个测试 使用 exec 也是可以的.

那么 这里 如何避免浏览器差异呢? 简单的办法 去掉/g即可

这里我们为了躲避陷阱 就要 记得一个约定.  请尽量不要使用 一个正则直接量 在函数体内 或 循环内. 如果一定要如此 请使用new RegExp('\d',g);这种.

对于exec 尽量用 string.match代替. 因为match 强制你依靠是否有 /g 来全局查找..不会产生歧义.

对于test 如果是循环内 也可以考虑  var reg=/\d/; //这里要吧/g去掉..请不要忘记哦

for (var i = 0; i < 10; i++) document.writeln(reg.test('' + i));

事实上这样用是最合理的办法 .原因是 这里我们只产生一个正则对象 并反复使用他.. 本质上也是为了优化。但是我们避开了 浏览器自己的优化差异 导致的不同结果.

最后我们发现 所谓陷阱 发生主要是 /g使用不当.无论是 exec 还是test都是如此  如果合理使用/g 无论浏览器是否存在变态的优化. 执行结果都将是正确的...唯一的区别 只在于 做了优化的浏览器 不需要反复产生一个 正则对象然后再垃圾回收 再产生一个正则对象....如此反复而已...

那么我们发现 遵守上面几个原则的话 这种问题 也都避免了...

(0)

相关推荐

  • 浏览器中的正则表达式陷阱说明

    在本章开始前 我要引入一个例子 来说明这种不彻底的 变态的优化 到底合理还是不合理... c# 中的 字符串直接量 做的优化 就非常彻底...这种优化我们应该是欢迎的... string str="franky"; string str2="franky"; 在内存中 只有一份 字符串对象 而str和str2 具备相同的一份引用. 很明显 这非常合理. string n = "franky",  n2 = "franky";R

  • JS中的正则表达式及pattern的注意事项

    RegExp对象的创建: 常规的正则表达式的创建可用直接量,即斜杠 "/" 括起来的字符.但在要求参数变化的环境下,RegExp()构造函数是更好的选择: var reg1 = /'\w+'/g; var reg2 = new RegExp('\'\\w+\'','g'); 对比两种创建方式,RegExp中的第一个参数为要创建的正则字符串,一方面注意,因为不是直接量的表示形式,因此不用斜杠" / "括起来了:而是字符串中必须要对引号" ' "和转

  • JavaScript中的this陷阱的最全收集并整理(没有之一)

    当有人问起你JavaScript有什么特点的时候,你可能立马就想到了单线程.事件驱动.面向对象等一堆词语,但是如果真的让你解释一下这些概念,可能真解释不清楚.有句话这么说:如果你不能向一个6岁小孩解释清楚一个东西,那么你自己也不懂这个东西.这句话或许有点夸张,但是极其有道理.个人觉得,如果需要掌握一门语言,掌握它的API只是学了皮毛,理解这门语言的精髓才是重点.提及JavaScript的精髓,this.闭包.作用域链.函数是当之无愧的.这门语言正式因为这几个东西而变得魅力无穷. 博客的标题是<J

  • Replace中的正则表达式

    replace:把原有的字符替换成新的字符 1. replace的字符串替换 var str = 'pku2016pku2017'; str = str.replace('pku', 'pkusoft'); console.log(str); // pkusoft2016pku2017 在不使用正则的情况下,每次执行只能替换一个字符,每次执行都是从0开始替换,有重复的,无法全部替换 2. replace的正则的替换 str = str.replace(/pku/g, 'pkusoft'); //

  • 深入浅析js中的正则表达式

    阅读目录 正则表达式的创建 正则表达式中的特殊字符 \ (反斜杠) ^ $ *,  +,  .(小数点) ? (问号) (x) (?:x) x(?=y), x(?!y), x|y {n}, {n,m}: [xyz], [^xyz] 其他 正则表达式标志 正则表达式使用 很多时候多会被正则表达式搞的晕头转向,最近抽出时间对正则表达式进行了系统的学习,整理如下: 正则表达式的创建 两种方法,一种是直接写,由包含在斜杠之间的模式组成:另一种是调用RegExp对象的构造函数. 两种方法的创建代码如下:

  • Perl中的正则表达式介绍

    感谢AKA及作者. Perl 中的正则表达式正则表达式的三种形式 正则表达式中的常用模式 正则表达式的 8 大原则 正则表达式是 Perl 语言的一大特色,也是 Perl 程序中的一点难点,不过如果大家能够很好的掌握他,就可以轻易地用正则表达式来完成字符串处理的任务,当然在 CGI 程序设计中就更能得心应手了.下面我们列出一些正则表达式书写时的一些基本语法规则. 9.1 正则表达式的三种形式首先我们应该知道 Perl 程序中,正则表达式有三种存在形式,他们分别是: 匹配:m/<regexp>;

  • 在python中使用正则表达式查找可嵌套字符串组

    在网上看到一个小需求,需要用正则表达式来处理.原需求如下: 找出文本中包含"因为--所以"的句子,并以两个词为中心对齐输出前后3个字,中间全输出,如果"因为"和"所以"中间还存在"因为""所以",也要找出来,另算一行,输出格式为: 行号 前面3个字 *因为* 全部 &所以& 后面3个字(标点符号算一个字) 2 还不是 *因为* 这里好, &所以& 没有人 实现方法如下: #e

  • iOS 中使用正则表达式判断身份证格式及银行卡号格式是否正确(推荐)

    1.有时候我们会用到上传身份证号,或者银行卡号,这个时候就需要我们对身份证号以及银行卡号,进行基本的判断. 下面便是身份证号的判断返回YES是合法,反之不合法 #pragma mark 判断身份证号是否合法 - (BOOL)judgeIdentityStringValid:(NSString *)identityString { if (identityString.length != 18) return NO; // 正则表达式判断基本 身份证号是否满足格式 NSString *regex2

  • EditPlus中的正则表达式实战(5)

    相关阅读: EditPlus中的正则表达式 实战(1) EditPlus中的正则表达式 实战(2) EditPlus 正则表达式 实战(3) EditPlus中的正则表达式 实战(4) EditPlus中的正则表达式实战(5) EditPlus中的正则表达式实战(6) HUANZHEXM病人姓名 SHENFENZH身份证 RUYUANSJ入院时间 RUYUANKSMC入院科室名称 CHUYUANSJ出院时间 CHUYUANKSMC出院科室名称 RUYUANZZDDM入院诊断代码 RUYUANZZ

  • EditPlus中的正则表达式 实战(1)

    相关阅读: EditPlus中的正则表达式 实战(1) EditPlus中的正则表达式 实战(2) EditPlus 正则表达式 实战(3) EditPlus中的正则表达式 实战(4) EditPlus中的正则表达式实战(5) EditPlus中的正则表达式实战(6) entity.JIANCHARQ=null; entity.YUYUERQ=null; entity.NIAODANB=null; entity.XUETANGPJ=null; entity.JIANCHADWBM=null; e

随机推荐