使用汉字构形检索疑难字
在汉语文字研究者的工作中,肯定会需要处理生僻汉字。某些专业汉字工作者会使用支持全汉字集的五笔等形码输入法输入汉字,但大部分研究者并不了解形码输入。在不懂得汉字的读音,甚至不太清楚汉字所属部首的场合下,可以使用汉字速查工具的构形检索功能,快速找出该汉字,并复制到系统剪贴板,录入到文字处理器。
要使用汉字构形检索功能,请点击工具栏上“检字功能”对应的“构形”按钮。然后,程序将弹出构形检索界面。
下面以几个汉字为例,讲解汉字速查的构形汉字检索功能。
例1:基本检索,检索(\u20969)字
此汉字包含“其”字,另一部件形态不详,可在“构形部件”栏中输入“其”。然后点击“检索”按钮。在字符选项卡中将列出包含“其”字部件的汉字。如下图所示。
将字体按笔画排序,在“20”画处可找到该汉字。
按键盘Ctrl+C组合键,或点击工具栏上的“复制”按钮,可将该字复制到系统剪贴板,然后粘贴到支持统一码全字符集的程序中。
例2:从构形字典数据反查部件
上述示例汉字外面的那个框形结构,实际上是一个汉字。如果下载了《汉字构形数据库》或《表意文字描述序列》数据库,可从数据库的表述数据中找到该汉字。如下图所示。
如需要检索的另一个汉字包含该汉字部件,可通过此法复制出汉字部件,然后将其粘贴到汉字构形检索界面检索包含该汉字为部件的汉字。如下图所示。
例3:趣味检索,包含三个“火”的字
在“构形部件”栏中输入“火火火”,如果选中了“输入两个部件起自动检索”复选框,程序将自动检索包含连续三个“火”部件的汉字(如未选中该复选框,请点击“检索”按钮开始检索)。如下图所示。
说明:可以使用“部件+重复次数”的形式表示重复部件,如上示例,可直接输入“火3”,代表连续出现的三个“火”。
例4:异写字根通查
程序包含一个异写部件数据库,在选中“异写字根通查”复选框后,可通过输入较容易输入的部件来替代较难输入的部件。例如“火”与“灬”通、“水”与“氵”通、“足”与“”通,输入前者可检索出包含所通用部件的汉字。如下所示,输入“足刀”相当于检索“足刀”或“刂”:
例5:简繁部件通查
程序包含一个简繁字体对照数据库,在选中“简繁体部件通查”复选框后,简繁部件可相互通用。例如“车”与“車”通、“龙”与“龍”通、“韦”与“韋”通,输入前者可检索出包含所通用部件的汉字。如下所示,输入“龙飞”可检索得包含“龍”和“飛”的汉字。
例6:自定义通查部件
构形检索功能支持自定义通查部件。例如,可自定义“草”与“艹”相通。方法如下。
- 用记事本创建一个文本文件。
- 在该文件中输入如下内容“草 艹”。其中“草”与“艹”之间输入一个制表符。
- 将该文件保存到汉字速查的程序目录下,指定编码为“UTF-8”,保存的文件名为“自定义异体字表.txt”(如下图所示)。
- 在构形检索对话框中,选中“加载自定义异体字表”复选框。
- 输入检索部件,程序将会将“草”视为与“艹”相通。
自定义异体字表的格式为:
- 每行代表一组相通的汉字。
- 每个汉字之间用制表符(Tab)隔开。
- 如果无法输入该汉字,可使用 Unicode 十六进制格式,如“U+F3E9 八”,表示汉字部件“F3E9”与“八”字相通。
- 文件必须保存为 UTF-8 格式,否则将无法被程序加载。