C#中的正则表达式双引号问题

其中如果包含的字符串中包含双引号,那么就两个双引号表示,而不是反斜杠加上双引号(\”),也不是斜杠加上双引号(/”)

  正则表达式获取CSS里面的图片的例子,里面有URL里面的图片地址有双引号,要注意用两个双引号""表示

static void Main(string[] args)
    {
      Regex reg = new Regex(@"url\((['""]?)(.+[^'""])\1\)"); //注意里面的引号 要用双引号表示,而不是用反斜杠
      Console.WriteLine(reg.Match(@"{background-image:url(//ssl.gstatic.com/ui/v1/menu/checkmark.png);backgro")); //输出 url(//ssl.gstatic.com/ui/v1/menu/checkmark.png)

      Console.ReadKey();
    }

带组名的后向引用在C#中是 \k<num> ,匹配重复单词的例子:

static void Main(string[] args)
    {
      Regex reg = new Regex(@"\b(?<group>\w+ +)\k<group>");
      string str = "what the hell are you you talking about?";
      Console.WriteLine(reg.Match(str));

      Console.ReadKey();
    }

在C#中new一个Regex对象的时候,第二个参数能够用枚举支持选择匹配模式,现在就来说说这些枚举值对正则的影响。

   模式              说明

   .SingleLine           点号能够匹配任何字符
   .Multiline            扩展^和$的匹配,使^和$能够匹配字符串内部的换行符
   .IgnorePatternWhitespace   设计宽松排列和注释模式
   .IgnoreCase          进行不区分大小写的匹配
    .ECMAScript          限制\w \s \d,令其只对ASCII字符有效
   .RightToLeft          传动装置的驱动过程不变,但是方向相反(从字符的末尾开始,向开头移动)
   .Compiled           多花些时间优化正则表达式,编译到dll里,占用多点内存,但是匹配更快。
   .ExplicitCapture        普通括号()在正常情况下是捕获型括号,但是在此模式下与(?:...)一样,之分组,不捕获

   RegexOptions.Compiled的意义

  使用RegexOptions.Compiled与不使用RegexOptions.Compiled的对比

  标准      不使用          使用

  启动速度    较快           较慢(最多60倍)
  内存占用    少            多(每个正则表达式占用5-15KB)
  匹配速度    一般           最多能提升10倍

  在使用了RegexOptons.Compiled时,在程序执行过程中,这块内存会一直被占用,无法被释放,因此仅对于那些经常被使用的正则表达式才适合使用此选项。

  ECMAScript模式

  要注意ECMAScript只能与下面的选项同时使用

  RegexOptons.IgnoreCase
  RegexOptons.Multiline
  RegexOptons.Compiled

  而且反斜线-数字不会有反向引用和十进制转移的二义性,因为它只能够表示反向引用。例如 \10 表示反向引用 \1 然后是文字0。如果没有启用该模式,则 \12 匹配的是ASCII进纸符linefeed。同时\w \d \s \W \D \S只能匹配ASCII。

  另外在C#中,分组的编号也需要注意。
  分组0是整个正则表达式匹配到的结果。
  然后依次是未命名分组。
  最后是命名分组。

  例如:

  (\w)(?<Num>\d+)(\s+)

   1   3     2

  特殊的Replacement处理

  Regex.Replace方法和Match.Result方法都可以接收能够进行特殊处理的replacement字符串。下面的字符序列会被匹配到的文本所替换:

  字符序列          替换内容

  $&              整个表达式匹配的文本,相当于$0
  $1  $2            对应编号的捕获分组所匹配的文本
  ${name}          对应命名捕获分组匹配的文本
  $‘             目标字符串中匹配文本之前的文本
  $'             目标字符串中匹配文本之后的文本
    $$             单个$字符($1的显示为$$!)
  $_             正则原始目标字符串的副本
  $+             .NET中表示最后的那个捕获型括号匹配的文本

static void Main(string[] args)
    {
      Regex reg1 = new Regex(@"\d+");
      string str = reg1.Replace("123","insert into table where id = $&");
      Console.WriteLine(str);   //输出 insert into table where id = 123

      Regex reg2 = new Regex(@"1\+1=(\d)");
      string str2 = reg2.Replace("1+1=3","不是$1");
      Console.WriteLine(str2);  //输出 不是3

      Regex reg3 = new Regex(@"1\+1=(?<result>\d)");
      string str3 = reg3.Replace("1+1=3", "不是${result}");
      Console.WriteLine(str3);  //输出 不是3

      Regex reg4 = new Regex(@"\d+");
      string str4 = reg4.Replace("123ABC", "后面是$'"); //匹配文本之后的文本
      Console.WriteLine(str4);  //输出 后面是ABCABC   为什么会输出 后面是ABCABC呢?因为$'指的是ABC,然后替换掉原字符串中的123。不懂看多几次这句话

      Regex reg5 = new Regex(@"\d+");
      string str5 = reg5.Replace("ABC123", "前面是$`"); //ABC前面是ABC 符号是 1左边那个
      Console.WriteLine(str5);

      Regex reg6 = new Regex(@"\d+");
      string str6 = reg6.Replace("ABC123","右边原始输入字符串$_");
      Console.WriteLine(str6);  //输出 右边是原始字符串ABC123

      Console.ReadKey();
    }

关于.net中的正则装配件是用于构建正则表达式库的,保存在硬盘中,其他程序也能够调用,提高重用率。主要就是用到了Regex类的CompileToAssembly方法。   

今天,碰到一个非常有趣的问题,公司多了个客户,产品那边说添加关键词太辛苦,让我帮忙批量导入一批关键词。哥这几天正好在研究正则表达式呢,于是二话不说,立马应了下来。一看,Excel,算了NPOI还没学呢。于是复制到txt文本里。
格式如下:
中山大道
粤垦路
.....
天助我也,难度不大,而且看来这几天学的东西有用武之地了。于是立马有了以下代码

static void Main(string[] args)
{
  string str = File.ReadAllText(@"D:\daoru.txt", Encoding.Default);
  Regex reg = new Regex(@".+");
  string str1 = reg.Replace(str, "insert into Keyword values(196,'admin1','admin1','$&')");
  File.WriteAllText(@"D:\123.txt", str1);

  Console.ReadKey();
}

这是一个根据关键词生成SQL语句的方法,从D盘导入txt文本(在这个地方,碰到一个问题,因为关键词是中文,所以直觉上觉得应该用Utf-8编码去读,但是竟然出错了。于是上网查了一下,居然用Encoding.Default可以解决这个问题)。然后用正则表达式匹配到关键词。默认的new Regex() 点号.是不会匹配换行符的,因此非常适合关键词一行一个的,例如从Excel复制过来的时候。然后用Regex类提供的Replace将关键词替换成Sql语句,直接黏贴到数据库上全选,执行。OK。一次过导入了近500个关键词。

  本来以为正则表达式学得不错了,结果昨天替换的SQL语句就出了问题,存入数据库的数据无缘无故多了个换行符。其实在执行SQL语句的时候,SQLSERVER已经很尽职地给出提示了,可惜太大意或者说高兴得太早直接忽略了。来看昨天SQL语句执行时的图片:

看到换行了吧,这样一来就会将在结果中多了个\r,在数据库表中还看不到,但是在用的时候,如果仅仅用于显示,也没问题,但是如果用来匹配,那就悲剧了。因此今天更改了程序。要将换行符替换掉。代码改为如下所示,其中改动部分红色标记:

static void Main(string[] args)
    {
      string str = File.ReadAllText(@"D:\daoru.txt", Encoding.Default);
      Regex reg = new Regex(@".+");
      string str1 = reg.Replace(str, "insert into JM_SinaBlog_KeyWord values(105,'jmeii','jmeii','$&')").Replace((char)13, (char)0);//here
      File.WriteAllText(@"D:\123.txt", str1);

      Console.ReadKey();
    }

这样一来,就替换掉换行符了。将生成的代码再复制到SQLSERVER里,可以看到SQLSERVER的显示变了:

这样就没问题了,以后在写正则表达式时要对换行,空格非常敏感才行。

(0)

相关推荐

  • C#正则表达式获取下拉菜单(select)的相关属性值

    给几个在C#中,使用正则表达式取页面下拉菜单(select)中的值示例: 复制代码 代码如下: //取html中全部 select 的 name Regex reg_name = new Regex(@"(?<=<select name=\"").*?(?=\"")"); //取html中全部<select>项的值 Regex reg_select = new Regex("(?is)<select nam

  • C#正则表达式之Regex类用法详解

    Regex 类表示不可变(只读)的正则表达式.它还包含各种静态方法,允许在不显式创建其他类的实例的情况下使用其他正则表达式类. 正则表达式基础概述 什么是正则表达式 在编写字符串的处理程序时,经常会有查找符合某些复杂规则的字符串的需要.正则表达式就是用于描述这些规则的工具.换句话说,正则表达式就是记录文本规则的代码. 通常,我们在使用WINDOWS查找文件时,会使用通配符(*和?).如果你想查找某个目录下的所有Word文档时,你就可以使用*.doc进行查找,在这里,*就被解释为任意字符串.和通配

  • C#匹配中文字符串的4种正则表达式分享

    本文介绍在C#中使用匹配中文的正则表达式,包括纯中文.有中文.中文开头.中文结尾等几个正则表达式示例.在正则表达式中,中文可以通过Unicode编码来确定正则表达式范围. 在C#中,匹配中文的正则表达式用Unicode来表示时,范围是: [\u4e00-\u9fa5].所以,在此基础上,我们可以得到如下一些正则表达式. 1.匹配字符串全部是中文字符的正则表达式 复制代码 代码如下: "^[\u4e00-\u9fa5]+$" 说明:"^"表示字符串开头,"$

  • C#的正则表达式Regex类使用简明教程

    C#中为正则表达式的使用提供了非常强大的功能,这就是Regex类.这个包包含于System.Text.RegularExpressions命名空间下面,而这个命名空间所在DLL基本上在所有的项目模板中都不需要单独去添加引用,可以直接使用. 1.定义一个Regex类的实例 复制代码 代码如下: Regex regex = new Regex(@"\d"); 这里的初始化参数就是一个正则表达式,"\d"表示配置数字. 2.判断是否匹配 判断一个字符串,是否匹配一个正则表

  • C#通过正则表达式实现提取网页中的图片

    目前在做项目中有处理图片的部分,参考了一下网上案例,自己写了一个获取内容中的图片地址的方法. 一般来说一个 HTML 文档有很多标签,比如"<html>"."<body>"."<table>"等,想把文档中的 img 标签提取出来并不是一件容易的事.由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易.于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的 im

  • C#正则表达式判断输入日期格式是否正确

    本文将介绍一段实例代码,来讲解利用正则表达式使C#判断输入日期格式是否正确的方法.希望这段代码能对大家有所帮助. 通常我们在用C#编写系统程序或者Web开发时,都会遇到需要验证输入的字符串是否是日期的情况,下面为大家介绍一种非常全面的用正则表达式验证日期的方法: c 正则表达式日期代码一: /// <summary> /// 是否为日期型字符串 /// </summary> /// <param name="StrSource">日期字符串(2008

  • C# 校验帮助类正则表达式

    一.简介 很多时候我们都需要用到一些验证的方法,有时候需要用正则表达式校验数据时,往往需要到网上找很久,结果找到的还不是很符合自己想要的.所以我把自己整理的校验帮助类分享处理,在这里分享一下,给自己留了个底,也给各位需要的朋友们做个参考 二.校验类片段 2.1 邮箱验证 #region IsEmail(是否邮箱) /// <summary> /// 是否邮箱 /// </summary> /// <param name="value">邮箱地址<

  • C#中的正则表达式双引号问题

    其中如果包含的字符串中包含双引号,那么就两个双引号表示,而不是反斜杠加上双引号(\"),也不是斜杠加上双引号(/") 正则表达式获取CSS里面的图片的例子,里面有URL里面的图片地址有双引号,要注意用两个双引号""表示 static void Main(string[] args) { Regex reg = new Regex(@"url\((['""]?)(.+[^'""])\1\)"); //注意里面

  • MySQL中因一个双引号错位引发的血案详析

    一.前言 最近经常碰到开发误删除误更新数据,这不,他们又给我找了个麻烦,我们来看下整个过程. 二.过程 由于开发需要在生产环节中修复数据,需要执行120条SQL语句,需要将数据进行更新 于是开发连上了生产数据库,首先执行了第一条SQL update tablename set source_name = "bj1062-北京市朝阳区常营北辰福第" where source_name = "-北京市朝阳区常营北辰福第" 我们仔细看了下,这个SQL,的确没有什么问题,w

  • 使用JavaScript正则表达式如何去掉双引号

    最近接了一个项目,项目需求需要用js正则表达式过滤掉页面文本域中值得双引号,其实解决办法很简单,下面把我写的代码分享给大家,有同样需求的朋友可以参考下. 具体的解决代码如下: <html> <script language="javascript"> //var pattern = /[^"]*/; //校验字符串中是否都是非双引号的字符 var pattern = /["]+/; //校验字符串中是否有双引号的字符 //var patter

  • php中的单引号、双引号和转义字符详解

    PHP单引号及双引号均可以修饰字符串类型的数据,如果修饰的字符串中含有变量(例$name):最大的区别是: 双引号会替换变量的值,而单引号会把它当做字符串输出. 例如: <?php $name="string"; echo " 字符串" . '$name'; echo "字符串" . "$name"; ?> 结果: 字符串$name 字符串string 转义字符,顾名思义会将规定的语法用"\"来

  • 浅析Js中的单引号与双引号问题

    单引号和双引号其实没啥区别,看你自己习惯了 <input type="button" onclick="alert("1")">-------------------不正确<input type="button" onclick="alert('1')">-------------------正确 双引号中再用双引号要这样:var str = "abc\"def\

  • javascript单引号和双引号的区别和处理

    单引号和双引号其实没啥区别,看你自己习惯了 复制代码 代码如下: <input type="button" onclick="alert("1")">-------------------不正确 <input type="button" onclick="alert('1')">-------------------正确 双引号中再用双引号要这样: var str = "a

  • Java如何处理json字符串value多余双引号

    一.错误场景 json字符串的value值中有多余的双引号. 错误的json字符串 二.处理方案 自己写个方法将value值中多余的双引号替换为 中文双引号: // 处理json字符串中value多余的双引号, 将多余的双引号替换为中文双引号 private static String toJsonString(String s) { char[] tempArr = s.toCharArray(); int tempLength = tempArr.length; for (int i = 0

  • PHP去掉json字符串中的反斜杠\及去掉双引号前的反斜杠

    通过AJAX传到PHP的json字符串有时候加上反斜杠"\"来转义,PHP处理时需要先去掉反斜杠,然后再json_decode. $str = stripslashes($_POST['json']); $arr = json_decode($str,true); PS:php get抓取json怎样去除双引号前面的反斜杠 你这个不算标准的JSON格式数据,可以先将\"替换成"即可. 再用json_decode()系统函数将其转为json对象,如需转为数组加上第二个

  • 我遇到的参数传递中 双引号单引号嵌套问题

    最近学vml::cakepie.innerHTML="<v:shape id='cake"+(i+1)+"'type='#Cake_3D'"+                            " style='position:absolute;left:"+(_left + Height / 8)+"px;top:"+(_top + Height / 24)+"px;WIDTH:"+Heigh

  • 替换php字符串中的单引号为双引号的方法

    实例如下: $param = "{'id':'12', 'name':'hi'}"; $new = preg_replace('/\"/', '"', $param); 以上这篇替换php字符串中的单引号为双引号的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们.

随机推荐