HTML、CSS、JS对unicode字符的不同处理

unicode字符的不同表示法

unicode字符在html、css和js中的表示方法均不相同，下面分别作介绍。

原文发表于这里

1.1. css表示法

首先来一段很常见的bootstrap的字体图标代码：

.glyphicon-home:before {
	content: "\e021";
}

上面代码中的e021就是这个字符的unicode码，是16进制。

语法：

'\ + 16进制的unicode编码'

如：'\5b89'表示汉字“安”：

<div class="test"></div>
<style>
.test: before {content: "\e021";}
</style>

1.2. js表示方法

语法：

'\u + 16进制的unicode编码'

示例：

// 如：'\u5b89'表示汉字“安”
console.log('\u5b89'); // 输出“安”

1.3. html表示方法

html特殊一点，使用的是10进制，一开始没注意这个搞的半天出不来郁闷很久。

语法：

'&# + 10进制的unicode编码 + 英文分号;'

如& #23433;（注意，由于正常书写的话发表之后会被转换成汉字，所以我这里故意中间留了空格防止转换）表示汉字安，结尾的分号经测试不加也没问题，但是最好还是加一下。

<div>
	这是unicode表示的字符“安”：& #23433;（这里故意留一空格防止转换）
</div>

另外，一些特殊字符还有其它表示，也就是常说的html转义字符，如（由于自动转换问题，这里用图片表示)：

完整的HTML转义字符表可以参见这里：

http://tool.oschina.net/commons?type=2

获取汉字的unicode编码

那么，如何知道一个汉字的unicode的编码呢？很简单：

'安'.charCodeAt()； // 输出的 23433 就是汉字 安 的unicode编码，不过注意是10进制的
String.fromCharCode(23433); // 输出 '安'

得到了10进制的unicode编码，再如果想在js和css里面用的话，就需要用toString(16)转16进制再做进一步处理了。

var unicode = '\\u'+'茗'.charCodeAt().toString(16); // 输出字符串："\u8317"
JSON.parse('"'+unicode+'"'); // 输出汉字："茗"
eval('"'+unicode+'"'); // 或者使用eval解析也可以

posted @ 2021-01-04 14:30 ascertain 阅读(208) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾（3.3-3.9）
· winform 绘制太阳，地球，月球运作规律

公告

昵称： ascertain
园龄： 4年10个月
粉丝： 7
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

ascertain

HTML、CSS、JS对unicode字符的不同处理

unicode字符的不同表示法

1.1. css表示法

1.2. js表示方法

1.3. html表示方法

获取汉字的unicode编码

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论