正则表达式不包含属性

找出所有img标签的,没有带说明属性alt的标签:

正则:<img(?![^<>]*?alt[^<>]*?>).*?>
例子:<img src="" alt=""> <img src="" >  <img src="" title="">  <img src="" id="">  <img src=""  title="" alt="">

扩展,如果要找没有带title属性的a应该是:

正则:<a(?![^<>]*?title[^<>]*?>).*?>
例子:<a src="" alt=""> <a src="" >  <a src="" title="">  <a src="" id="">  <a src=""  title="" alt="">
用正则表达式找出不包含连续字符串abc的单词

[^abc]表示不包含a、b、c中任意字符, 我想实现不包含字符串abc应该如何写表达式?

就我自己而言,这个问题最简单的解决方法是使用编程语言的配合,找出那些包含abc的,剩下的就是不包含的了——懒人的风格。但我写的是教程,读者未必都有编程的基础,有些只是使用一些工具从txt文档中抽取出一些信息,所以要回答还是必须完全通过正则表达式来完成。

于是打开了RegexTester,开始试验,先是试了使用((?'test'abc)|.)*(?(test)(?!))(含意是:查找abc,或任意的字符,如果找到了abc,就把它存入命名为test的组里,到最后检查test组里是否有内容,如果有就匹配失败,相关说明见教程),结果是"abc","aabc","abcd","aa"都能通过测试,看来是到最后测试到test组存在后又回溯了,此解决方案不可行。

然后又试了(.(?!abc))*(找出所有后面不是abc的字符),结果是"abc","abcd"通过测试,"aabc"则只截取了后面的"abc",显然不行。

那加强条件试试:((?<!abc).(?!abc))*(找出所有前面和后面都不是abc的字符),结果是所有包含abc的字符串都只截取了里面的"abc",不包含abc的则直接通过。

现在看来有点戏了,但是怎么把那些内部包含abc的字符串过滤掉呢?这个问题换句话说也就是怎么匹配整体而不是部分呢?现在需要明确用户的需求了:如果用户想要找的是单词,那就在表达式的两端加上\b,如果要找的是行,就加上^和$。由于用户的问题没有明确说明,我就当作是单词吧。

于是等到了这样的表达式:\b((?<!abc).(?!abc))*\b,经过测试,这个表达式能匹配所有不包含abc的单词,以及单词abc。

怎么排除单词abc?经过一番思考,最后我认为判断单词是否以a开头的方式最为方便:\b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*\b(要么以后面不是bc的a开头,要么不以a开头,除了开头后面所有的字符必须前面和后面都不是abc)。经过测试,完全满足要求,Bingo!

使用正则表达式查找不包含连续字符串abc的单词,最终结果:\b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*\b
----------------
更新:根据maple的评论,更简洁的作法是:\b((?!abc)\w)+\b

正则表达式-不包含某个字符串

在使用正则表达式的场合,常常有这种需求,就是匹配一个不包含某个子串的子符串。比如说,我要从“eabcdfgh”得到"cd"之前的子串。有些人可能会写:

([^cd]*)

这种写法是彻底错误的,因为[]中的是集合,也就是说,[^cd]表示不等于c或者d,而不是cd。下面的程序中没有cd,但eab还是被匹配出来了。


代码如下:

String s = "([^cd]*)"; 
Match m = Regex.Match("eabcfgh", s); 
MessageBox.Show(m.Value);//eab 
MessageBox.Show(m.Groups[1].Value);//eab

上面这种写法是错的比较离谱的,正常青年一般都可以避免这种错误。在特殊情况下,正则表达式可以这么写,而且效率是比较高的。

([/s/S]*cd)

先说明下/s/S是表示匹配任何字符。所谓特殊情况,就是我知道这个字符串中必有cd的存在。假如,我的要求是匹配不包含cd的部分(为了描述方便,只匹配cd之前的部分),也就是说,当cd不存在时,应该把整个字符串都取出来。


代码如下:

String s = "((.(?!cd))*.)"; 
//String s = "([/s/S]*cd)"; 
Match m = Regex.Match("eabcdfgh", s); 
MessageBox.Show(m.Value);//eab 
MessageBox.Show(m.Groups[1].Value);//eab

这种写法终于符合要求了。不过值得一提的是,相较前一种而言,它的效率比较低。
回顾一下相关的语法:
(?:子表达式)         定义非捕获组。


代码如下:

//定义非捕获组 
String s = "e(?:ab)(.*)"; 
Match m = Regex.Match("eabcd", s); 
MessageBox.Show(m.Value);//eabcd 
MessageBox.Show(m.Groups[1].Value);//cd

ab是被匹配的,但是它所在的组没有被捕获,Group[1]是cd

(?=子表达式)       零宽度正预测先行断言。


代码如下:

//零宽度正预测先行断言 
//String s = "b(cd|de)(.*)"; 
String s = "b(?=cd|de)(.*)"; 
Match m = Regex.Match("eabcdfg", s); 
MessageBox.Show(m.Value); 
MessageBox.Show(m.Groups[1].Value);//区别 cd  cdfg

这种写法和注释掉的写法是有区别的,区别就是“零宽度”,这种写法会被捕获,也就是不占一个Group。

(?!子表达式)       零宽度负预测先行断言。

!表示非,就是不包含,同样是零宽度,不会被捕获。

(?<=子表达式)    零宽度正回顾后发断言。

例:(?<=19)\d{2}\b

“1851 1999 1950 1905 2003”中的“99”、“50”和“05”

(?<!子表达式)     零宽度负回顾后发断言。

例:(?<!19)\d{2}\b

“1851 1999 1950 1905 2003”中的“51”和“03”

(0)

相关推荐

  • 用正则删除不包含某个字符串的行的代码

    先说一下这个可疑的ip,58.63.144.170,据说是一个弱智的蜘蛛,上帝保佑它下地狱. 看过apache日志的朋友应该知道,apache的访问日志的每一行是以访问者的ip开始的.因为日志比较大,所以我是用ultraedit来看的.用ultraedit的时候需要注意,它的正则一共有两种,一种是符合perl规范的,而默认的是ut自带的一种,写法比较特殊.本文中用到的正则表达式都是perl兼容的,ut中这个选项可以在"高级->配置->搜索->正则表达式引擎"中进行修改

  • PHP正则提取不包含指定网址的图片地址的例子

    但是现在这个文章中可能含有一些表情,我们当然不能直接提取src路劲了,这样如果第一张是表情图片的话,就会提取表情图片来作为封面了,这时候我们就需要写清楚正则来排除不匹配的图片,下面是一个小列子: 复制代码 代码如下: $contents = '<p>疲惫是一种享受,让我们无暇空虚:坎坷是一种经历,让我们真切的理解人生:            忙碌是一种幸福,让我们没有时间体会痛苦:奔波是一种快乐,    <img src="http://img.baidu.com/hi/ldw

  • 用正则表达式表示不包含2950的字符串

    使用Excel中的VBA测试如下(匹配式为:^((?!2950).)*$): Sub Regs() Dim RegEx As Object Set RegEx = CreateObject("VBScript.regexp") Dim s, mat s = "399295078" RegEx.Pattern = "^((?!2950).)*$" RegEx.Global = True MsgBox RegEx.test(s) Set RegEx

  • 正则表达式匹配不包含某些字符串的技巧

    经常我们会遇到想找出不包含某个字符串的文本,程序员最容易想到的是在正则表达式里使用,^(hede)来过滤"hede"字串,但这种写法是错误的.我们可以这样写:[^hede],但这样的正则表达式完全是另外一个意思,它的意思是字符串里不能包含'h','e','d'三个但字符.那什么样的正则表达式能过滤出不包含完整"hello"字串的信息呢? 事实上,说正则表达式里不支持逆向匹配并不是百分之百的正确.就像这个问题,我们就可以使用否定式查找来模拟出逆向匹配,从而解决我们的问

  • 使用正则表达式找出不包含特定字符串的条目

    做日志分析工作的经常需要跟成千上万的日志条目打交道,为了在庞大的数据量中找到特定模式的数据,常常需要编写很多复杂的正则表达式.例如枚举出日志文件中不包含某个特定字符串的条目,找出不以某个特定字符串打头的条目,等等. 使用否定式前瞻 正则表达式中有前瞻(Lookahead)和后顾(Lookbehind)的概念,这两个术语非常形象的描述了正则引擎的匹配行为.需要注意一点,正则表达式中的前和后和我们一般理解的前后有点不同.一段文本,我们一般习惯把文本开头的方向称作"前面",文本末尾方向称为&

  • php 正则 不包含某字符串的正则表达式

    常见函数 strstr($str, "abc"); 正则匹配 preg_match("/(abc)?/is", $str); 但是要匹配一个字符串中,不包含某字符串,用正则就比较麻烦了 如果不用正则 !strstr($str, "abc"); 就可以解决问题了 但是用正则呢,就只有这样了,"/^((?!abc).)*$/is" //------------------------------------------------

  • 正则表达式不包含align该怎么写

    HTMLCode=" " var Pattern=/^ /ig;//tag p without align HTMLCode=HTMLCode.replace(Pattern,""); alert(HTMLCode); [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

  • 正则表达式不包含属性

    找出所有img标签的,没有带说明属性alt的标签: 正则:<img(?![^<>]*?alt[^<>]*?>).*?> 例子:<img src="" alt=""> <img src="" >  <img src="" title="">  <img src="" id=""> 

  • java使用正则表达式查找包含的字符串示例

    本文实例讲述了java使用正则表达式查找包含的字符串.分享给大家供大家参考,具体如下: Hello.java: package hello; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Hello { public static void main(String[] args) { String re = "\\[([^\\]]+)\\]"; String str = &quo

  • JS正则表达式必须包含数字、字母、特殊字符

    下面给大家介绍下JS正则表达式 必须包含数字.字母.特殊字符 js正则表达式要求: 1. 必须包含数字.英文字母.特殊符号且大于等于8位 2. 特殊符号包括: ~!@#$%^&* 正则表达式如下: /^(?=.*\d)(?=.*[a-zA-Z])(?=.*[~!@#$%^&*])[\da-zA-Z~!@#$%^&*]{8,}$/ 解释: 这里主要用到了js正则表式中的正向前瞻 ?=,举个例子 /\d/.exec( 'abc2abc' ) 匹配结果为2,释义:匹配一个数字 /\d(?

  • ASP.NET Core使用EF创建模型(包含属性、排除属性、主键和生成值)

    目录 1.什么是Fluent API? 2.包含属性和排除属性 2.1包含属性 2.2排除属性 2.2.1数据批注 2.2.2Fluent API 3.主键 3.1数据批注 3.2Fluent API 4.生成值 4.1数据批注 4.1.1无值生成 4.1.2在添加时生成值 4.1.3在添加或更新时生成值 4.2Fluent API 4.2.1无值生成 4.2.2在添加时生成值 4.2.3在添加或更新时生成值 1.什么是Fluent API? EF中内嵌的约定将POCO类映射到表.但是,有时您无

  • JavaScript 正则表达式之RegExp属性、方法及应用分析

    使用RegExp的显式构造函数,语法为:new RegExp("pattern"[,"flags"]). 使用RegExp的隐式构造函数,采用纯文本格式:/pattern/[flags]. pattern部分为要使用的正则表达式模式文本,是必须的.在第一种方式中,pattern部分以JavaScript字符串的形式存在,需要使用双引号或单引号括起来:在第二种方式中,pattern部分嵌套在两个"/"之间,不能使用引号. flags部分设置正则表达

  • JavaScript正则表达式之multiline属性的应用

    多行正则表达式是对象的只读布尔属性.它指定是否一个特定的正则表达式进行多行匹配,即,不管是否使用"m"属性创建. 语法 RegExpObject.multiline 下面是参数的详细信息: NA 返回值: 如果"m"修改被设置返回"TRUE",否则返回"FALSE". 例子: <html> <head> <title>JavaScript RegExp multiline Property&

  • js正则表达式之input属性($_)RegExp对象属性介绍

    功能说明:该属性为RegExp的静态只读属性,该属性的值为与RegExp对象所描述的正则表达式进行匹配检测的字符串,该属性也可以表示成$_ 复制代码 代码如下: <html> <script language="javascript" type="text/javascript"> //objStr 为待匹配的内容 var objStr='abcDdefCDDE'; //创建正则表达式,i表示匹配忽略大小写 var re=/cd+e/i;//

  • 利用JSONObject.toJSONString()包含或排除指定的属性

    目录 JSONObject.toJSONString包含或排除指定的属性 演示程序 JSONObjecttoJSONString遇到的坑 引入pom文件 使用JSONObject输出int类型的map JSONObject.toJSONString包含或排除指定的属性 将一个实体对象转换成Json字符串 JSON.toJSONString() FastJson提供的SerializeFilter类可以指定转换时要包含的属性,或者指定转换时要排除的属性. JSONObject.toJSONStri

  • js正则表达式常用函数详解(续)

    正则表达式对象的方法 1.test,返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式.如果存在则返回 true,否则就返回 false. 2.exec,用正则表达式模式在字符串中运行查找,并返回包含该查找结果的一个数组. 3.compile,把正则表达式编译为内部格式,从而执行得更快. 正则表达式对象的属性 1.source,返回正则表达式模式的文本的复本.只读. 2.lastIndex,返回字符位置,它是被查找字符串中下一次成功匹配的开始位置. 3.input ($_),返回

随机推荐