正则表达式中的反向预搜索实现

在以前的应用,大多是应用正向预搜索情况。也就是说,在查找内容的右面有特定的内容限定,例如下面的例子:


var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04';
var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim;
str3.match(reg3);
alert(RegExp.$1); //结果是2G

[Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

(.*(?=\;OS\:) 就是典型的正向预搜索,只有右面内容是“;OS: ”才会被匹配到。

但是现在要实现的效果,左面的内容是固定,而不是右面。可是JavaScript并不支持反向预搜索。我相信,细心的朋友已经发现了,其实上面的例子已经达到了这个目的(前面的Memory\:\s+ 限定了左面的内容)。下面再给出一个例子:


代码如下:

//程序目的,去掉图片路径中的域名
var str = '<img src="http://news.163.com/sports/yao.jpg" src="http://news.163.com/sports/yao.jpg">';
var reg1 = /(\<img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim;
str.match(reg1);
alert(str.replace(RegExp.$4,''));

那么到底有没有反向预搜索呢?答案是肯定的,可是现实是残酷的。我查阅了一些资料,上面提到反向预搜索的形式是以?<= 或者?<! 为引导的。遗憾的是JavaScript并不支持,在高版本的Java中已获支持,于是就编写了下面的测试程序(JRE1.6.0_03):


代码如下:

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class RegExpTest {
    public static void main(String[] args){
        Pattern p = Pattern.compile("((?<=\\<img.*(?=(http|https)))(http|https))");
        Matcher matcher = p.matcher("<img src="http://news.163.com/sports/yao.jpg" src="http://news.163.com/sports/yao.jpg"/>");
        System.out.println(matcher.matches());
    }
}

程序本身应该没有什么问题,但是运行结果:
Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 27
((?<=\<img.*(?=(http|https)))(http|https))
我Google了半天,最后得到的唯一结果就是换种写法。希望看到这篇文章的朋友,如果已经实现了这种效果,一定要留言不吝赐教。
另外,在我看文档时看到了?:引导的正则表达式,上面说是“匹配不存储”,百思不得其解。感觉还是代码来的实在,写一个看一下:


代码如下:

var str2 = '客户端名称';
var reg2 = /(客户端名(?:称)?)/;
str2.match(reg2);
alert(RegExp.$1); //客户端名称
alert(RegExp.$2); //空字符串
//不使用?:
reg2 = /(客户端名(称)?)/;
str2.match(reg2);
alert(RegExp.$1); //客户端名称
alert(RegExp.$2); //称

敏捷开发思想说:代码是最好的文档。给了我借口,呵呵。

(0)

相关推荐

  • 优化Python代码使其加快作用域内的查找

    我将示范微优化(micro optimization)如何提升python代码5%的执行速度.5%!同时也会触怒任何维护你代码的人. 但实际上,这篇文章只是解释一下你偶尔会在标准库或者其他人的代码中碰到的代码.我们先看一个标准库的例子,collections.OrderedDict类: def __setitem__(self, key, value, dict_setitem=dict.__setitem__): if key not in self: root = self.__root l

  • python实现多线程暴力破解登陆路由器功能代码分享

    运行时请在其目录下添加user.txt passwd.txt两文件.否则会报错.程序没有加异常处理.代码比较挫..... 复制代码 代码如下: #coding:utf-8- import base64 import urllib2 import Queue import threading,re,sys queue = Queue.Queue() class Rout_thread(threading.Thread): def __init__(self,queue,passwd): threa

  • 正则表达式中的反向预搜索实现

    在以前的应用,大多是应用正向预搜索情况.也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim; str3.match(reg3); alert(RegExp.$1); //结果是2G [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行] (.*(?=\;OS\:) 就是典型

  • 正则表达式中的反向预搜索(上)

    在以前的应用,大多是应用正向预搜索情况.也就是说,在查找内容的右面有特定的内容限定,例如下面的例子: 复制代码 代码如下: var str3 = 'CPU: Intel Core2 5200; Memory: 2G;OS: Ubuntu 9.04'; var reg3 = /Memory\:\s+(.*(?=\;OS\:))/gim; str3.match(reg3); alert(RegExp.$1); //结果是2G (.*(?=\;OS\:) 就是典型的正向预搜索,只有右面内容是";OS:

  • 正则表达式中的反向预搜索(下)

    代码为: 复制代码 代码如下: //程序目的,去掉图片路径中的域名 var str = '<img src="http://www.jb51.net/images/logo.gif">'; var reg1 = /(\<img)(.*(?=(http|https)\:\/\/))((http|https)\:\/\/[^\/]*)/gim; str.match(reg1); alert(str.replace(RegExp.$4,''); 这个用法在字符串中只有一个U

  • 正则表达式中的正向预查和负向预查实例分析

    本文实例讲述了正则表达式中的正向预查和负向预查.分享给大家供大家参考.具体分析如下: 这里先来看一个例子,再来解释什么是正向预查. 例子:有一段内容为"coming soon,going gogogo",要求把com和go查找出来.代码如下: 复制代码 代码如下: <html> <head> <script type="text/javascript"> //正向预查 function t1(){  var con = docum

  • 正则表达式中的正向预查和负向预查

    日常工作当中,大多数IDE自带的查找工作都能满足大多数需要. 加上正则匹配简直如虎添翼.匹配个邮箱,电话号什么的不在话下.有时候我们可能会遇到稍微特殊的场景. Windows 1.03 and Windows 2.0 fisrt Released in 1985 and 1987 respectively. Windows 95 and Windows 98 are the successor. Then Windows 2000 and Windows Xp Windows appeared.

  • php正则表达式中贪婪与非贪婪介绍

    一.贪婪与非贪婪 什么叫贪婪,比如说要从字符串中<td>面包一</td><td>面包二</td>吃面包,本来你只可以吃面包一,可是你贪心,于是就把第一个<td>到最后一个</td>里面的两个面包取出来了,你想多吃点,非贪婪也就是你不贪吃了,就只吃面包一. 我们来看看正则里面是怎么贪婪的 <?php $str = '<td>面包一</td><td>面包二</td>'; preg_ma

  • 正则表达式中问号(?)的正确用法详解

    目录 1.直接跟随在子表达式后面 2.非贪婪匹配 3.非获取匹配 4.断言 参考资料: 正则表达式中“?”的用法大概有以下几种 1.直接跟随在子表达式后面 这种方式是最常用的用法,具体表示匹配前面的一次或者0次,类似于{0,1},如:abc(d)?可匹配abc和abcd 2.非贪婪匹配 关于贪婪和非贪婪,贪婪匹配的意思是,在同一个匹配项中,尽量匹配更多所搜索的字符,非贪婪则相反.正则匹配的默认模式是贪婪模式,当?号跟在如下限制符后面时,使用非贪婪模式(*,+,?,{n},{n,},{n,m})

  • 正则表达式中的 .*? 或 .*+ 的意思

    正则表达式简介 正则表达式,又称规则表达式.(英语:Regular Expression,在代码中常简写为regex.regexp或RE),计算机科学的一个概念.正则表达式通常被用来检索.替换那些符合某个模式(规则)的文本. 许多程序设计语言都支持利用正则表达式进行字符串操作.例如,在Perl中就内建了一个功能强大的正则表达式引擎.正则表达式这个概念最初是由Unix中的工具软件(例如sed和grep)普及开的.正则表达式通常缩写成"regex",单数有regexp.regex,复数有r

  • 浅析正则表达式中的lastIndex以及预查

    依次写出下列输出内容. var reg1 = /a/; var reg2 = /a/g; console.log(reg1.test('abcabc')); // true console.log(reg1.test('abcabc')); // true console.log(reg1.test('abcabc')); // true console.log(reg1.test('abcabc')); // true console.log(reg2.test('abcabc')); //

  • php中正则表达式中的特殊符号

    字符/  意义:对于字符,通常表示按字面意义,指出接着的字符为特殊字符,不作解释.  例如:/b/匹配字符'b',通过在b 前面加一个反斜杠,也就是/b/,则该字符变成特殊字符,表示  匹配一个单词的分界线.  或者:  对于几个字符,通常说明是特殊的,指出紧接着的字符不是特殊的,而应该按字面解释.  例如:*是一个特殊字符,匹配任意个字符(包括0个字符):例如:/a*/意味匹配0个或多个a.为了匹配字面上的*,在a前面加一个反斜杠:例如:/a*/匹配'a*'. 字符^  意义:表示匹配的字符必

随机推荐