javascript正则表达式和字符串RegExp and String(二)

在上篇文章给大家介绍了javascript正则表达式和字符串RegExp and String(一),本文给大家继续分享相关内容。

前言

我认为,在学习一门编程语言的过程中,字符串、数组、容器是非常重要的部分,为了提高编程效率,我通常会对字符串、数组以及容器作深入的学习,详细了解相关特点及对应的API。这篇文章是针对javascript字符串学习写下的笔记,在此与需要的朋友分享。

思维导图

字符串的创建方式

字符串是javascript中的基本类型之一,它对应的类型是String,可以通过两种方式来创建字符串:

通过变量赋值的方式, 创建字符串的基本类型
通过构造方法(String),创建字符串对象

虽然两种方式创建出的字符串表现形式不一样,但在某些场景下,我们需要的是字符串,但不关心它是字符串基本类型还是字符串对象。在这种场景下,字符串的判断就会发生了一点小小的变化。

具体可参照下面代码加深理解:

var s = 'abcd1234DCBA'; //推荐的创建字符串方式
var s1 = 'abcd1234DCBA';
var s2 = new String(s); // 通过构造方法创建字符串
var s3 = new String(s);
console.log(s===s1); //true 具有值类型的特性
console.log(s===s2); //false 基本类型和对象不相等
console.log(s2===s3); //false 不同的对象不相等
console.log(typeof s); // string
console.log(typeof s2); // object
//判断输入值是否是基本类型字符串
function isString(s) {
 return typeof s === 'string'
}
console.log(isString(s)); //true
console.log(isString(s2)); //false
//判断输入值是否是字符串(基本类型+字符串对象形式)
function isString2(s) {
 return s != null && typeof s.valueOf() === 'string';
}
console.log(isString2(s)); //true
console.log(isString2(s2)); //true

字符串的值不变特性

字符串在Javascript中是不可变的。所谓的不可变是指当你生成一个字符串后,然后调用该字符串的API来操作该字符串,该字符串的原始值是不会发生变化的,调用处理后的结果是一个新的字符串。
可参照下面代码加深理解:

  var s = new String('abc');
  var r = s.toUpperCase();
  alert(s);  // abc  s本身是不会发生变化的
  alert(r);  //  ABC

常用API - 字符串截取

不关于字符串的截取,掌握下面三个API即可:

slice : String.slice(N1,N2) 这个就是我们常用的从指定的位置(N1)到指定的位置(N2)的字符串;
substring : String.substring(N1,N2) 这个就是我们常用的从指定的位置(N1)到指定的位置(N2)的字符串;
substr : String.substr(N1,N2) 这个就是我们常用的从指定的位置(N1)截取指定长度(N2)的字符串;

可参考下面代码加深理解:

var s = '0123456789';
var r1 = s.substring(1); //123456789 第二个参数默认为字符length
var r2 = s.substring(1,5); //1234
var r3 = s.substring(1); //123456789 第二个参数默认为字符length
var r4 = s.substring(1,5); //1234
var r5 = s.substr(1); //123456789 第二个参数默认为字符length
var r6 = s.substr(2,5); //23456
var r7 = s.substr(2,100); //23456789 第二个参数大于字符length,不受影响

常用API - 字符串检索

关于字符串的检索操作,掌握下面三个API即可。字符串检索在其它编程语言中很常见,indexOf以及lastIndexOf这两个API子啊其它编程语言中非常常见,理解起来也相对容易。关于search,和indexOf类似,只是它的输入参数不是检索的字符串,而是一个正则表达式, 返回值为正则表达式第一个匹配项的索引。

具体可参考下面代码加深理解:

var s = '0123abc401234';
console.log(s.indexOf('23')); // 2
console.log(s.lastIndexOf('23')); // 10
console.log(s.search(/[a-z]+/g)); // 4 检索出现字符的开始位置

常用API - 字符串替换

JS中一般调用replace方法来对字符串中某些字符的替换,该方法接收两个参数:
* 第一个参数是用来描述要被替换的子字符串,参数类型可以是字符串也可以是正则表达式。这里千万要注意,如果是字符串,则只会替换原字符串中第一个匹配的子串,而如果是未设置标识'g'的正则表达式,替换时得出的结果也是一样的,如果想替换所有匹配的子字符串,则必须传入带有标识g的正则表达式
* 第二个参数是用来描述替换值。参数类型可以是一个字符串,也可以是一个函数,还可以是包含特殊序列字符(RegExp的静态属性:−/&/‘/'/1..n/$$等)。

具体可参照下面代码加深理解:

代码一. 基本匹配操作

var s = 'cat,bat,sat,fat';
var res = s.replace('at','NE');
console.log(res);//cNE,bat,sat,fat 只替换第一个匹配项
var res1 = s.replace(/at/,'NE');
console.log(res1); //cNE,bat,sat,fat 还是只替换第一个匹配项
var res2 = s.replace(/at/g,'NE');
console.log(res2); //cNE,bNE,sNE,fNE 替换所有的匹配项

代码二 . 第二个参数是函数

var s = 'ab<name>cd';
// 模拟HTML对符合 < >进行转义
var res = s.replace(/[<>]/g,function(match,index,souStr) {
  switch(match) {
  case '<': return '&lt';
  case '>': return '&gt';
  }
});
console.log(res); // ab&ltname&gtcd

代码三. 才有特殊序列字符进行灵活替换

// 针对字符sou,将关键字key用{}扩起来
function strong(sou,key) {
 var re = new RegExp('('+key+')','g');
 return sou.replace(re,'{$1}'); //$1 第一个捕获组
}
console.log(strong(s,'at')); //c{at},b{at},s{at},f{at}
// 针对字符sou,将关键字key用{}扩起来
 function strong2(sou,key) {
 var re = new RegExp(key,'g');
 return sou.replace(re,'{$&}'); //$& 匹配的字符串
 }
console.log(strong2(s,'at')); //c{at},b{at},s{at},f{at}

常用API - 字符串分组

JS中采用split方法来对字符串进行分组,该方法可接收两个参数:
* 第一个参数表示分隔符,可以是字符串类型,也可以是RegExp对象。
* 第二个参数是可选的,表示接收组的数量,也就是返回结果数组的大 小。如果不指定该参数,表示返回所有组。
具体可参照下面代码加深理解:

var s = 'cat,bat,sat,fat';
var res = s.split(',');
console.log(res); //[ 'cat', 'bat', 'sat', 'fat' ]
var res2 = s.split(/,/);
console.log(res2); //[ 'cat', 'bat', 'sat', 'fat' ]
var res3 = s.split(/,/,2);
console.log(res3); //[ 'cat', 'bat' ] 只返回2组

常用API - 字符串匹配

match() 方法将检索字符串 stringObject,以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。

如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。

如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。

注意:在全局检索模式下,match() 即不提供与子表达式匹配的文本的信息,也不声明每个匹配子串的位置。如果您需要这些全局检索的信息,可以使用 RegExp.exec()。

具体可以参照下面代码加深理解:

var s = 'cat,bat,sat,fat';
var reg = /[a-z](at)/ ;
console.log(s.match(reg)); //[ 'cat', 'at', index: 0, input: 'cat,bat,sat,fat' ]
var res = s.match(/[a-z](at)/g);
console.log(res); //[ 'cat', 'bat', 'sat', 'fat' ]

常用API - 字符串比较

两种比较方式,一种是才有 大于或小于符号,另一种是采用localeCompare方法,注意该方法的返回的是一个数字,数字的含义与其它编程语言比较结果类似,不作过多解释了。牵涉的区域相关,推荐使用localeCompare来对字符串进行比较。
具体可参照下面代码加深理解:

var s1 = 'abc';
var s2 = 'bcd';
var s3 = new String('abc');
console.log(s1>s2); //true
console.log(s1==s3); //true 将s1与s3.toString()进行比较
console.log(s1.localeCompare(s2)); // -1 s1 小于 s2
console.log(s1.localeCompare(s3)); // 0 s1的值与s3相等

以上内容就是本文给大家分享的javascript正则表达式和字符串RegExp and String(二),希望大家喜欢。

(0)

相关推荐

  • javascript 中String.match()与RegExp.exec()的区别说明

    1. 这两个方法,如果匹配成功,返回一个数组,匹配失败,返回null. 2. 当RegExp的global属性为false时,这两个方法的返回数组是一样的. 数组的第0个元素是整个pattern的第一个匹配字符串,接下来的元素是pattern第一个匹配中的子匹配字符串. 此外,数组还有index和input两个额外属性,index是匹配字符串的起始位置,input是整个输入字符串. 此时,RegExp的lastIndex属性一直是0. demo: 复制代码 代码如下: var s = 'this

  • javascript正则表达式和字符串RegExp and String(一)

    前言 正则表达式是javascript非常重要和常用的功能,在jquery等大型框架中用的非常频繁,最近抽时间学习了解了相关知识,记录下来与需要的朋友分享. 思维导图 RegExp(正则表达式)的创建方式 可以通过两种方式创建一个RegExp,具体如下: 通过/-./的方式来创建正则表达式(注意: /--/两边是没有单引号或双引号的) 通过RegExp构造方法来创建一正则表达式 为了更好的描述模式,正则表达式提供了3个标识,分别是: g/i/m g: 全局匹配:在整个字符串中匹配,而不是在第一次

  • javascript 正则替换 replace(regExp, function)用法

    复制代码 代码如下: function fn() { for(var i = 0;i < arguments.length;i++){ alert("第"+(i+1)+"个参数的值:"+arguments[i]); } } var str = '<div id="{wo}" >{ni}</div>'; str.replace(/\{([a-z]+)\}/ig, fn); 根据多次测试由输出结果可以得出fn中: 第一个

  • js正则表达式讲解之index属性(RegExp对象)

    功能:index与search返回的值相同,不管是是否匹配到合适内容,如果找到合适内容则index为匹配内容其实字符的起始位置,如果没有找到则返回-1 基本语法RegExp.index 注意:该属性也是RegExp的静态属性,调用方式固定. 复制代码 代码如下: <html> <script language="javascript" type="text/javascript"> //alert('Designed By Androidyu

  • 详解JavaScript RegExp对象

    什么是 RegExp? 正则表达式描述了字符的模式对象. 当您检索某个文本时,可以使用一种模式来描述要检索的内容.RegExp 就是这种模式. 简单的模式可以是一个单独的字符. 更复杂的模式包括了更多的字符,并可用于解析.格式检查.替换等等. 您可以规定字符串中的检索位置,以及要检索的字符类型,等等. RegExp对象是原生JavaScript中表示正则表达式的对象. 创建对象的方法为:var RegExp = new RegExp(pattern, attributes); 参数pattern

  • JavaScript 核心参考教程 RegExp对象

    正则表达式的直接量字符字符 匹配字母数字字符 本身\o NUL字符(\u0000)\t 制位表(\u0009)\n 换行符(\u000A)\v 垂直制位表(\u000B)\f 换页符(\u000C)\r 回车(\u000D)\xnn 由十六进制数nn指定的拉丁字符,例如\u0A等价于\n\uxxxx 由十六进制数xxxx指定的Unicode字符,例如\u0009等价于\t\cX 控制字符X,例如,\cJ等价于\n 正则表达式的字符类字符 匹配[...] 位于括号内的任意字符[^...] 不在括号

  • 正则(JS)re=new RegExp("^\\d*$");与re=/^\d*$/;之间区别?

    以下代码结果为:FALSE,TRUE,TRUE      请问结果中为什么第一个为FALSE?      <form   name=form1>      字符串:<input   name="t1"   value="123456">      模式:/<input   name="t2"   value="^\d*$">/      </form>      <scri

  • javascript RegExp对象(正则表达式)

    使用RegExp的显式构造函数,语法为:new RegExp("pattern"[,"flags"]). 使用RegExp的隐式构造函数,采用纯文本格式:/pattern/[flags]. pattern部分为要使用的正则表达式模式文本,是必须的.在第一种方式中,pattern部分以JavaScript字符串的形式存在,需要使用双引号或单引号括起来:在第二种方式中,pattern部分嵌套在两个"/"之间,不能使用引号. flags部分设置正则表达

  • JavaScript学习小结(7)之JS RegExp

    在js中,正则表达式是由一个RegExp对象表示的,RegExp 是正则表达式的缩写.RegExp简单的模式可以是一个单独的字符.更复杂的模式包括了更多的字符,并可用于解析.格式检查.替换等等.可以使用一个RegExp()构造函数来创建RegExp对象,也可以使用直接量语法. 1.RegExp简介. RegExp即正则表达式(Regular Expression,在代码中常简写为regex.regexp或RE/re/reg),就是使用单个字符串来描述.匹配一系列符合某个句法规则的字符串搜索模式,

  • JavaScript通过RegExp实现客户端验证处理程序

    1.让文本框只允许输入数字,运用asp.net mvc3.0的文本框控件 复制代码 代码如下: @Html.TextBox("txt",null, new {@style="width:300;",onkeypress="return RegValidateIsDigit(event)" }) 可以看到在文本框中注册了onkeypress事件,当在文本框中输入一个字符按下键盘的时候就会触发该JavaScript的函数 复制代码 代码如下: <

  • JS正则中的RegExp对象对象

    有两种方式可以创建RegExp对象的实例. 使用RegExp的显式构造函数,语法为:new RegExp("pattern"[,"flags"]). 使用RegExp的隐式构造函数,采用纯文本格式:/pattern/[flags]. pattern部分为要使用的正则表达式模式文本,是必须的.在第一种方式中,pattern部分以JavaScript字符串的形式存在,需要使用双引号或单引号括起来:在第二种方式中,pattern部分嵌套在两个"/"之间

  • javascript RegExp multiline多行匹配影响的^$

    内容全写注释里了- - 复制代码 代码如下: <script type="text/javascript"> /^$/.test('\n'); //false,为什么呢,说明如下 var p = /^/mg; var s = '1\n\n\n2\n\n3'; p.test(s); //跳过开始位置JS里好象没那个词- - p.test(s); alert(RegExp.rightContext.replace(/\x0A/g, '\\a')); //由此得出^匹配的是\n后

随机推荐