在ES6之前,js字符串一直基于16位字符编码进行构建的(UTF-16),每16位的序列是一个编码单元,代表一个字符。length,charAt()等字符串属性和方法都是基于这种编码单元构造的。Unicode引入了扩展字符集,编码规则改变了。前2^16码位以16位的编码单元表示,超过这个范围就用32位表示。所以以前的charCodeAt等方法是无法正确返回32位的UTF-16字符的码点的。
charCodeAt() 方法可返回指定位置的字符的 Unicode 编码。这个返回值是 0 - 65535 之间的整数。
1、codePointAt正确返回 32 位的 UTF-16 字符的码点。对于那些两个字节储存的常规字符(前2^16码位以前),它的返回结果与charCodeAt方法相同。(并不是常规字符就在非常规字符前面)
codePointAt方法返回的是码点的十进制值,如果想要十六进制的值,可以使用toString
方法转换一下。
2、String.fromCharCode()用于从码点返回对应字符 但是只能返回16位的字符,32位的不行。和charCodeAt相对
String.fromCodePoint 可以返回32位的字符 与codePointAt相对