02 2013 档案
摘要:在开发调试汉文博士的过程中,我发现 Unihan 有不少汉字的笔画数是有问题的。例如 http://www.unicode.org/cgi-bin/GetUnihanData.pl?codepoint=5A59 这个“婙”字,总笔画数是 9 画,部首笔画字段居然是女部 8 画。使用部首检索功能检索就会发现统一汉字数据库的笔画数据里有一大堆问题,如下图所示。同一个部首下笔画数相同的汉字居然有不同的总...
阅读全文
摘要:期待已久的词典编译器终于发布了。从今天开始,我将逐步向大家介绍如何制作词典数据库。制作词典数据库至少要有两个文件:第一个是编译器所用的配置文件;第二个是词典的文本内容,即源数据文件。编译器的配置文件用于告诉程序如何将词典的文本内容编译 成词典数据库,配置文件是 XML 文件,要按一定的语法撰写。而源数据文件的结构则是自由的。只要文本数据有一定的规律,都可能可以通过编写配置文件来编译成数据库。下面,让我们从最简单的地方开始,制作一个只有两个词条的词典数据库。本示例所采用的文件可在此处下载。源数据文件首先,使用记事本或其它文本编辑器,编写一个词典文本文件(示例1.txt),其内容如下:一yi1最简
阅读全文
摘要:新一版的《汉文博士》(原《汉字速查》)已经发布。新版本增加了一个导出汉字图片的工具,可以将某个字库的汉字逐个导出成图片文件。此外,本次更新还修复了词典编译器的若干问题。
阅读全文
摘要:经过了近一年的开发,现在《汉字速查》的功能已不仅限于检索汉语字典了。该工具的特色是具有较强的汉字检索能力,同时包含汉语词典的检索功能。模糊检索词条功能似为其它同类型词典所无,独树一帜。“汉字速查”之名已不能代表软件的功能,我拟将《汉字速查》更名为《汉文博士》,使之与软件功能匹配。《汉文博士》将定位为一个学习研究汉语言文字的开放式字典词典检索工具,重点是汉语文词的研究,并且计划将词典的序言、体例等文献亦纳入电子数据库的范畴。程序采用开放式的数据库结构,可由使用者自己通过词典编译器编译现存的文本文件,生成字典和词典数据库。是故称此软件为“博士”,指软件可包容博大精深的中国语文知识。诸位对此更名有何
阅读全文

浙公网安备 33010602011771号