将HTML的左右尖括号等转义成实体形式的两种实现方式

前端开发工作中,经常需要将HTML的左右尖括号等转义成实体形式。我们不能把<,>,&等直接显示在最终看到的网页里。需要将其转义后才能在网页上显示。

转义字符(Escape Sequence)也称字符实体(Character Entity)。定义转义字符串的主要原因是

“<”和“>”等符号已经用来表示HTML TAG,因此不能直接当作文本中的符号来使用。但有时需求是在HTML页面上使用这些符号,所以需要定义它的转义字符串。
有些字符在ASCII字符集中没有定义(如版权符号“©”)。因此需要使用转义字符(“©”对应的转义字符是“©”)来表示。

这里提供两个函数escape和unescape,分别实现将HTML转义为实体和回转。

方式一、一个映射表+正则替换


代码如下:

var keys = Object.keys || function(obj) {
obj = Object(obj)
var arr = []
for (var a in obj) arr.push(a)
return arr
}
var invert = function(obj) {
obj = Object(obj)
var result = {}
for (var a in obj) result[obj[a]] = a
return result
}
var entityMap = {
escape: {
'&': '&',
'<': '<',
'>': '>',
'"': '"',
"'": '''
}
}
entityMap.unescape = invert(entityMap.escape)
var entityReg = {
escape: RegExp('[' + keys(entityMap.escape).join('') + ']', 'g'),
unescape: RegExp('(' + keys(entityMap.unescape).join('|') + ')', 'g')
}

// 将HTML转义为实体
function escape(html) {
if (typeof html !== 'string') return ''
return html.replace(entityReg.escape, function(match) {
return entityMap.escape[match]
})
}
// 将实体转回为HTML
function unescape(str) {
if (typeof str !== 'string') return ''
return str.replace(entityReg.unescape, function(match) {
return entityMap.unescape[match]
})
}

方式二、利用浏览器DOM API


代码如下:

// 将HTML转义为实体
function escape(html){
var elem = document.createElement('div')
var txt = document.createTextNode(html)
elem.appendChild(txt)
return elem.innerHTML;
}
// 将实体转回为HTML
function unescape(str) {
var elem = document.createElement('div')
elem.innerHTML = str
return elem.innerText || elem.textContent
}

有个缺陷是只能转义“< > & ”,对于单引号,双引号都不转义。另外一些非ASCII也不能转义。选择时须注意。

比较:

方式1 代码量较大,但灵活性,完整性都比方式2强。可根据需求添加或减少映射表entityMap,且可以运行在任意JS环境中。

方式2 为hack方式,代码量少很多,利用浏览器内部API就行了转义和转回(主流浏览器都支持)。不具完整性,很明显只能在浏览器环境中使用(比如不能在Node.js中跑)。

(0)

相关推荐

  • 将HTML的左右尖括号等转义成实体形式的两种实现方式

    前端开发工作中,经常需要将HTML的左右尖括号等转义成实体形式.我们不能把<,>,&等直接显示在最终看到的网页里.需要将其转义后才能在网页上显示. 转义字符(Escape Sequence)也称字符实体(Character Entity).定义转义字符串的主要原因是 "<"和">"等符号已经用来表示HTML TAG,因此不能直接当作文本中的符号来使用.但有时需求是在HTML页面上使用这些符号,所以需要定义它的转义字符串. 有些字符在A

  • 使用JS正则表达式 替换括号,尖括号等

    如下所示: function toTxt(str) { var RexStr = /\<|\>|\"|\'|\&/g str = str.replace(RexStr, function(MatchStr) { switch (MatchStr) { case "<": return "<"; break; case ">": return ">"; break; case

  • perl中尖括号运算符(<>)使用说明

    perl中<>运算符可以有如下的用途: 1)如果尖括号中间是文件句柄,尖括号运算符允许你读取文件句柄,比如<STDIN>.2) 如果尖括号中间是搜索模式,尖括号运算符能返回与该模式匹配的文件列表,这称为一个glob,比如< *.bat>.3)一组尖括号运算符如果中间没有任何东西,那么它可以读取命令行上所有文件的内容:如果没有给出文件名,则可以读取标准输出. 请看下面这段代码: 复制代码 代码如下: while(<>){print $_;} 如果将上面的程序保

  • asp 过滤尖括号内所有内容的正则代码

    当然这应该属于正常过滤手法,而还有一种过滤HTML标签的最终极手法,则是将一对尖括号及尖括号中的所有字符均替换不显示,该方法对于内容中必须描述有关尖括号内容过滤过头了. 不过,总归是有需要将所有尖括号中内容全部替换的时候,很显然是需要进行正则的,有两种代码,第一种如下: 复制代码 代码如下: Function nohtml(str) dim re Set re=new RegExp re.IgnoreCase =true re.Global=True re.Pattern="(\<.[^\

  • include包含头文件的语句中,双引号和尖括号的区别(详解)

    #include <>格式:引用标准库头文件,编译器从标准库目录开始搜索 #incluce ""格式:引用非标准库的头文件,编译器从用户的工作目录开始搜索 预处理器发现 #include 指令后,就会寻找后跟的文件名并把这个文件的内容包含到当前文件中.被包含文件中的文本将替换源代码文件中的#include指令,就像你把被包含文件中的全部内容键入到源文件中的这个位置一样. #include 指令有两种使用形式 #include <stdio.h> 文件名放在尖括号

  • 深入理解Bash中的尖括号(适合初学者)

    前言 Bash 内置了很多诸如 ls.cd.mv 这样的重要的命令,也有很多诸如 grep.awk.sed 这些有用的工具.但除此之外,其实 Bash 中还有很多可以起到胶水作用的标点符号,例如点号(.).逗号(,).括号(<>).引号(")之类.下面我们就来看一下可以用来进行数据转换和转移的尖括号(<>). 转移数据 如果你对其它编程语言有所了解,你会知道尖括号 < 和 > 一般是作为逻辑运算符,用来比较两个值之间的大小关系.如果你还编写 HTML,尖括号作

  • Bash中尖括号的更多使用方法

    前言 在这篇文章,我们继续来深入探讨尖括号的更多其它用法. 在上一篇文章当中,我们介绍了尖括号(<>)以及它们的一些用法.在这篇文章,我们继续来深入探讨尖括号的更多其它用法. 通过使用 <,可以实现"欺骗"的效果,让其它命令认为某个命令的输出是一个文件. 例如,在进行备份文件的时候不确定备份是否完整,就需要去确认某个目录是否已经包含从原目录中复制过去的所有文件.你可以试一下这样操作: diff <(ls /original/dir/) <(ls /back

  • Json_encode防止汉字转义成unicode的方法

    大家都知道,json_encode通常会把json中的汉字转义成unicode,但是这并不一定是我们想要的.有时候,我们需要获得汉字形式的json字符串,比如需要获得gbk编码的json字符串(只要把汉字形式的字符串转码就可以得到了).有什么好办法么? php官方听到了这个需求,并提供了一种可靠的解决方案:JSON_UNESCAPED_UNICODE.这个参数可以保证json_encode不再将汉字转为unicode. 似乎这样就解决了?当我们高高兴兴的用这个参数的时候,发现并没有什么卵用.仔细

  • php字符串中转义成特殊字符实例讲解

    在php的字符串使用时,我们有学会一些转义字符,相信大家在记忆这些知识点的时候费了不少的功夫.本篇我们为大家带来的是字符串的转义方法,涉及到特殊字符的使用,主要有两种方法可以实现:mysql库函数和转义函数.下面就这两种方法,在下文中展开详细的介绍. 1.转义字符说明 双引号中,所有转义字符都可正常使用. 单引号中,只有单引号转义字符可以使用("),别的都不可使用. 2.利用mysql库函数 PHP版本在7.0之前: mysql_escape_string ( string $unescaped

  • 解决RestTemplate 请求url中包含百分号 会被转义成25的问题

    目录 RestTemplate 请求url中包含百分号 会被转义成25 解决方法 RestTemplate转码bug 转码问题的背景 结论 为什么会有这个问题? RestTemplate 请求url中包含百分号 会被转义成25 最初使用RestTemplate 进行远程调用方法如下: private String getRemoteData(String url) { logger.info("Request URL :" + url + "|"); String

随机推荐