收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)

正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番。我将一些常用的表达式收藏在这里,作备忘之用。本贴随时会更新,请持续关注本站。

匹配中文字符的正则表达式: [\u4e00-\u9fa5]

匹配双字节字符(包括汉字在内):[^\x00-\xff]

应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)

String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;}

匹配空行的正则表达式:\n[\s| ]*\r

匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/

匹配首尾空格的正则表达式:(^\s*)|(\s*$)

String.prototype.trim = function()
{
  return this.replace(/(^\s*)|(\s*$)/g, "");
}

利用正则表达式分解和转换IP地址:

下面是利用正则表达式匹配IP地址,并将IP地址转换成对应数值的Javascript程序:

function IP2V(ip)
{
 re=/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配IP地址的正则表达式
if(re.test(ip))
{
return RegExp.1∗Math.pow(255,3))+RegExp.2*Math.pow(255,2))+RegExp.3∗255+RegExp.4*1
}
else
{
 throw new Error("Not a valid IP address!")
}
}

不过上面的程序如果不用正则表达式,而直接用split函数来分解可能更简单,程序如下:

var ip="10.100.20.168"
ip=ip.split(".")
alert("IP值是:"+(ip[0]*255*255*255+ip[1]*255*255+ip[2]*255+ip[3]*1))

匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

匹配网址URL的正则表达式:http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?

利用正则表达式去除字串中重复的字符的算法程序:[注:此程序不正确,原因见红色字体]

var s="abacabefgeeii"
var s1=s.replace(/(.).*\1/g,"$1")
var re=new RegExp("["+s1+"]","g")
var s2=s.replace(re,"")
alert(s1+s2) //结果为:abcefgi

===============================

如果var s = "abacabefggeeii"

结果就不对了,结果为:abeicfgg

正则表达式的能力有限

我原来在CSDN上发贴寻求一个表达式来实现去除重复字符的方法,最终没有找到,这是我能想到的最简单的实现方法。思路是使用后向引用取出包括重复的字符,再以重复的字符建立第二个表达式,取到不重复的字符,两者串连。这个方法对于字符顺序有要求的字符串可能不适用。

得用正则表达式从URL地址中提取文件名的javascript程序,如下结果为page1

s="http://www.9499.net/page1.htm"
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$2")
alert(s)

利用正则表达式限制网页表单里的文本框输入内容:

用正则表达式限制只能输入中文:

onkeyup="value=value.replace(/[^\u4E00-\u9FA5]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\u4E00-\u9FA5]/g,''))"

用正则表达式限制只能输入全角字符:

 onkeyup="value=value.replace(/[^\uFF00-\uFFFF]/g,'')" onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\uFF00-\uFFFF]/g,''))"

用正则表达式限制只能输入数字:

onkeyup="value=value.replace(/[^\d]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

用正则表达式限制只能输入数字和英文:

onkeyup="value=value.replace(/[\W]/g,'') "onbeforepaste="clipboardData.setData('text',clipboardData.getData('text').replace(/[^\d]/g,''))"

应用:javascript中没有像vbscript那样的trim函数,我们就可以利用这个表达式来实现,如下:

/**
 * 计算字符串长度,将非宽字符计算为半个字符
 *
 * @param str
 * @returns
 */
function gbLength(str) {
  return typeof str === "string" ? str.length + str.replace(/[\x00-\x7f]/g, '').length + 1 >> 1 : 0;
}

/**
 * 获取字符串的指定长度的子串,将非宽字符计算为半个字符
 *
 * @param str
 * @param length
 * @returns
 */
function gbSubstr(str, length) {
  if (typeof str !== "string")
    return str;
  length += length;
  for ( var n = 0, L = str.length; n < L && length > 0; n++){
    length -= str.charCodeAt(n) > 127 ? 2 : 1;
  }
  return str.substr(0, n);
}
/**
 * 切割指定字符串的指定长度子串,如果长度超过指定长度,则丢弃末尾两个字符并附加...
 *
 * @param str
 * @param len
 * @returns
 */
function fit_length(str, len){
  len = len || 16;
  if (typeof str !== "string" || str.length <= len || gbLength(str) <= len){
    return str;
  }
  var ret = gbSubstr(str, len - 2);
  return ret + '..';
}
var replaceCJK = /[^\x00-\xff]/g,
  testCJK  = /[^\x00-\xff]/;

    cjkLength: function(strValue){
      return strValue.replace(replaceCJK, "lv").length;
    },
    isCjk: function(strValue){
      return testCJK.test(strValue);
    },
    cutString: function(str,len,suffix,slen){
      suffix = suffix || '';
      slen = slen || suffix.length;
      if(str.length > len){
        str = str.substr(0,len - slen) + suffix;
      }
      return str;
    },
    cutCjkString: function(str,len,suffix,slen){
      suffix = suffix || '';
      slen = slen || suffix.length;
      len -= slen;
      if(this.cjkLength(str) <= len){
        return str;
      }
      var s = str.split(''),c = 0,tmpA = [];
      for(var i=0;i<s.length;i+=1){
        if(c < len){
          tmpA[tmpA.length] = s[i];
        }
        if(this.isCjk(s[i])){
          c += 2;
        }else{
          c += 1;
        }
      }
      return tmpA.join('') + suffix;
    }
  }

以上内容给大家分享我日常收集的一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~),希望大家喜欢。欲了解更多,请持续关注本站。

(0)

相关推荐

  • 通过正则表达式删除空行的方法

    我们的目标是要删除文本中的空行,可能一行也可能是多行. 所以,我的操作如下: 在此,我们匹配空行用的是 (\r\n)* 这样,就可以匹配多个空行,同时用null来替代,就可以实现删除空行.此方案是基于对\r和\n的使用. 以前在网上看到一种实现是: \n[\s| ]*\r 匹配之后,用null替代,也可以实现删除空行,效果如下图: 两种方案都能实现相同的效果. 如果有其他的不同理解,请发表评论,大家共同进步. 我又做了以下测试,如下图: 仅用了 \n\r 就完全实现了删除所有的空行,因为在每一个

  • javascript 正则表达式去空行方法

    去除前导和后续空格 /(^\s*)|(\s*$)/g 范例如下: 函数体: String.prototype.trim=function(){ return this.replace(/(^\s*)|(\s*$)/g,''); } 使用方法: var s=' 你好 '; alert( s.trim() ); 如果要清楚所有空格,包括中间的,范例如下: var s='a b c '; String.prototype.clearSpacebar=function(){ return this.re

  • 收集一些常用的正则表达式(匹配中文字符、匹配双字节字符、匹配HTML标记、匹配空行 and so on~~~)

    正则表达式用于字符串处理,表单验证等场合,实用高效,但用到时总是不太把握,以致往往要上网查一番.我将一些常用的表达式收藏在这里,作备忘之用.本贴随时会更新,请持续关注本站. 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 匹配双字节字符(包括汉字在内):[^\x00-\xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"a

  • Javascript将双字节字符转换成单字节字符并计算长度

    复制代码 代码如下: function(s){     return Math.ceil(s.replace(/[\u4e00-\u9fa5]/g, 'xx').length / 2); } 也可以用(/[^\x00-\xff]/g,'**'),这个是用'**'替换双字节字符 (/[\u4e00-\u9fa5]/g, '**') 这个是用'**'替换中文字符,\u4e00-\u9fa5中文的unicode编吗 以上就是本文的全部内容,了解更多JavaScript的语法,大家可以查看:<JavaS

  • Flex 处理双字节字符(判断汉字长度)的方法

    如下代码可以计算出双字节字符的长度. 复制代码 代码如下: /** * <p>機能:入力したデータのバイト数を取得する</p> * <p>処理概要:</p> * <ol> * <li></li> * </ol> * @param String * @return int */ private function getStrActualLen(sChars:String) : int { return sChar

  • C++多字节字符与宽字节字符相互转换

    最近在C++编程中经常遇到需要多字节字符与宽字节字符相互转换的问题,一直自己贴那几句代码.觉得麻烦,于是就自己写了一个类来封装wchar_t与char类型间的转换,其他的,诸如:CString\ LPWSTR\TCHAR CHAR\LPSTR之间也是一样用 复制代码 代码如下: #include <iostream> using namespace std; class CUser { public: CUser(); virtual~ CUser(); char* WcharToChar(w

  • 积累比较常用的正则表达式(例如:匹配中文、匹配html)

    正则表达式(Regular Expression,在代码中常简写为regex.regexp或RE)是计算机科学的一个概念.正则表达式使用单个字符串来描述.匹配一系列符合某个句法规则的字符串.在很多文本编辑器里,正则表达式通常被用来检索.替换那些符合某个模式的文本.许多程序设计语言都支持利用正则表达式进行字符串操作.在很多文本编辑器里,正则表达式通常被用来检索.替换那些符合某个模式的文本. 匹配中文字符的正则表达式: [u4e00-u9fa5]   评注:匹配中文还真是个头疼的事,有了这个表达式就

  • 匹配中文汉字的正则表达式介绍

    \w匹配的仅仅是中文,数字,字母,对于国人来讲,仅匹配中文时常会用到,见下 复制代码 代码如下: 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 或许你也需要匹配双字节字符,中文也是双字节的字符 复制代码 代码如下: 匹配双字节字符(包括汉字在内):[^\x00-\xff] 注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) PS:关于正则,本站还提供了2款非常简便实用的正则表达式工具供大家参考使用: JavaScript正则表达式在线测试工具: http:/

  • 收集的一些常用java正则表达式

    只能输入数字:"^[0-9]*$".只能输入n位的数字:"^\d{n}$".只能输入至少n位的数字:"^\d{n,}$".只能输入m~n位的数字:."^\d{m,n}$"只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$".只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$".只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,

  • PHP一些常用的正则表达式字符的一些转换

    匹配双字节字符(包括汉字在内): [^\x00-\xff] 应用:计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) String.prototype.len=function(){return this.replace([^\x00-\xff]/g,"aa").length;} 匹配空行的正则表达式: \n[\s| ]*\r 匹配HTML标记的正则表达式: /<(.*)>.*<\/>|<(.*) \/>/ 匹配首尾空格的正则表达式: (

  • 正则表达式匹配中文与双字节的代码

    匹配中文字符 [\u4e00-\u9fa5] C# 复制代码 代码如下: class Class1 { static void Main() { string s = "中文 chinese"; Regex regx = new Regex("[\u4e00-\u9fa5]+"); Match m = regx.Match(s); Console.WriteLine(m.Groups[0].Value); // 中文 Console.ReadKey(); } } 匹

  • 利用正则表达式进行中文排版的实例教程

    目录 前言 〇.常见匹配类 一.段落排版类 1.非段落换行排版(要求段落之间空一行) 2.插入空行 3.删除空行 4.行首批量添加(替换项为2个空格时可实现首行缩进) 5.行尾批量添加 6.半角引号替换为全角引号 7.半角单引号替换全角 8.固定宽度加硬回车(下例为宽度50) 二.删除特定字符串类 1.删除行前空格 2.删除行尾空格 3.删除包含指定关键字的行 4.删除以指定关键字开头的行 5.删除HTML注释 6.删除HTML标签 7.删除HTML标签内的全部 三.中文汉字处理类 1.中文和英

随机推荐