2016年10月11日

自然语言处理3.3——使用Unicode进行文字处理

摘要: 全世界有多种语言,经常需要应用程序处理不同的语言和字符集。下面将介绍如何利用Unicode处理使用非ASCII字符集文字。 1.什么是Unicode Unicode支持一百万种以上的字符,每一个字符分配一个编号,称为编码点。在Python中编码点写作\uXXXX,其中XXXX是四位十六进制数。 在一 阅读全文

posted @ 2016-10-11 22:20 波比12 阅读(799) 评论(0) 推荐(0) 编辑

导航