将HTML特殊转义为实体字符的两种实现方式
前端开发工作中,经常需要将HTML的左右尖括号等转义成实体形式。我们不能把<,>,&等直接显示在最终看到的网页里。需要将其转义后才能在网页上显示。
转义字符(Escape Sequence)也称字符实体(Character Entity)。定义转义字符串的主要原因是
- “<”和“>”等符号已经用来表示HTML TAG,因此不能直接当作文本中的符号来使用。但有时需求是在HTML页面上使用这些符号,所以需要定义它的转义字符串。
- 有些字符在ASCII字符集中没有定义(如版权符号“©”)。因此需要使用转义字符(“©”对应的转义字符是“©”)来表示。
这里提供两个函数escape和unescape,分别实现将HTML转义为实体和回转。
方式一、一个映射表+正则替换
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 | var keys = Object.keys || function (obj) { obj = Object(obj) var arr = [] for ( var a in obj) arr.push(a) return arr } var invert = function (obj) { obj = Object(obj) var result = {} for ( var a in obj) result[obj[a]] = a return result } var entityMap = { escape: { '&' : '&' , '<' : '<' , '>' : '>' , '"' : '"' , "'" : ' '' } } entityMap.unescape = invert(entityMap.escape) var entityReg = { escape: RegExp( '[' + keys(entityMap.escape).join( '' ) + ']' , 'g' ), unescape: RegExp( '(' + keys(entityMap.unescape).join( '|' ) + ')' , 'g' ) } // 将HTML转义为实体 function escape(html) { if ( typeof html !== 'string' ) return '' return html.replace(entityReg.escape, function (match) { return entityMap.escape[match] }) } // 将实体转回为HTML function unescape(str) { if ( typeof str !== 'string' ) return '' return str.replace(entityReg.unescape, function (match) { return entityMap.unescape[match] }) } |
方式二、利用浏览器DOM API
1 2 3 4 5 6 7 8 9 10 11 12 13 | // 将HTML转义为实体 function escape(html){ var elem = document.createElement( 'div' ) var txt = document.createTextNode(html) elem.appendChild(txt) return elem.innerHTML; } // 将实体转回为HTML function unescape(str) { var elem = document.createElement( 'div' ) elem.innerHTML = str return elem.innerText || elem.textContent } |
有个缺陷是只能转义“< > & ”,对于单引号,双引号都不转义。另外一些非ASCII也不能转义。选择时须注意。
比较:
方式1 代码量较大,但灵活性,完整性都比方式2强。可根据需求添加或减少映射表entityMap,且可以运行在任意JS环境中。
方式2 为hack方式,代码量少很多,利用浏览器内部API就行了转义和转回(主流浏览器都支持)。不具完整性,很明显只能在浏览器环境中使用(比如不能在Node.js中跑)。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端
2011-07-19 各浏览器对focusin/focusout事件的支持差异