u'囧'.encode('gb2312') throws UnicodeEncodeError

Unicode To UTF8 及编码过程实时解析

这也是一个资源链接

 

 

 

u'囧'.encode('gb2312') throws UnicodeEncodeError

在这个页面进行查询,https://www.qqxiuzi.cn/bianma/zifuji.php

字符集编码是指对多个字符(通常在几十到几万个不等)进行整合封装成一个文件所使用的编码,外部程序通过这种编码就可以从字符集文件中调用指定的字符。我们常见的计算机字体文件就使用了字符集编码,通过输入法输入文字或者浏览网页时都会通过指定的字符集编码从字体文件中调用字符。

以下是常见的汉字字符集编码:

GB2312编码:1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码,收录7445个图形字符,其中包括6763个汉字。

BIG5编码:台湾地区繁体中文标准字符集,采用双字节编码,共收录13053个中文字,1984年实施。

GBK编码:1995年12月发布的汉字编码国家标准,是对GB2312编码的扩充,对汉字采用双字节编码。GBK字符集共收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。

GB18030编码:2000年3月17日发布的汉字编码国家标准,是对GBK编码的扩充,覆盖中文、日文、朝鲜语和中国少数民族文字,其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。

Unicode编码:国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。

 

 

 

 

汉字国标码查询   千千秀字

国标码是汉字的国家标准编码,目前主要有GB2312、GBK、GB18030三种。

  1. GB2312编码方案于1980年发布,收录汉字6763个,采用双字节编码。
  2. GBK编码方案于1995年发布,收录汉字21003个,采用双字节编码。
  3. GB18030编码方案于2000年发布第一版,收录汉字27533个;2005年发布第二版,收录汉字70000余个,以及多种少数民族文字。GB18030采用单字节、双字节、四字节分段编码。

新版向下兼容旧版,也就是说GBK是在GB2312已有码位基础上增加新码位,GB18030是在GBK已有码位基础上增加新码位,各种编码方案中共有的字符编码相同。现在的中文信息处理应优先采用GB18030编码方案。

在本页中,你可以输入汉字查询对应的国标码,也可以输入国标码查询对应的汉字。三种编码方案分别给出结果,以便于核对查询的字符是否收录在该编码方案中,例如:“〇”字GB2312未收录,“𠀚”字GB2312和GBK未收录。

 

 

https://docs.microsoft.com/en-us/windows/win32/intl/code-page-identifiers

936 gb2312 ANSI/OEM Simplified Chinese (PRC, Singapore); Chinese Simplified (GB2312)
20936 x-cp20936 Simplified Chinese (GB2312); Chinese Simplified (GB2312-80)
52936 hz-gb-2312 HZ-GB2312 Simplified Chinese; Chinese Simplified (HZ)
54936 GB18030 Windows XP and later: GB18030 Simplified Chinese (4 byte); Chinese Simplified (GB18030)
作者:Chuck Lu    GitHub    
posted @   ChuckLu  阅读(131)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
历史上的今天:
2020-05-21 领域驱动设计DDD
2020-05-21 如何退出telnet
2019-05-21 vs 2019 create new project 创建新项目
2019-05-21 Aspect-Oriented Programming : Aspect-Oriented Programming with the RealProxy Class
2019-05-21 Aspect-oriented programming
2019-05-21 Gitblit用户没有push权限,但是已经在team里面配置了
2018-05-21 第三章 基本概念
点击右上角即可分享
微信分享提示