虎码快速入门教程
最近我需要写很多笔记,因此在网上找到了一种形码输入法。这个输入法的资料比较齐全,但是官网上的教程太混乱了,因此整理了一下教程。
虎码快速入门教程
虎码输入法简介
虎码是一种利用算法(模拟退火)优化后的汉字编码方法。该方法能够将一个汉字按照特定的规则编码为1至4个字母。基于这种编码方法输入的输入法,我们称之为虎码输入法。
虎码优化的目标
- 减少重复编码:尽量减少不同汉字之间的编码重复。
- 缩短常用字编码:针对高频使用的汉字,尽量缩短其编码长度,加快输入速度。
- 优化按键布局:尽量避免使用键盘边缘较难触及的字母,如
Q
、Z
、P
等,以提升输入的舒适度和效率。
虎码输入法属于形码输入法范畴。形码输入法通过将汉字拆解为多个字根,并依据这些字根进行编码输入,而非依据汉字的读音。这种输入方式为快速输入提供了另一种高效途径。
字根
字根是由多个笔画组成的汉字部件。如何确定哪些部件是字根,这是编码设计者需要考虑的问题。不同编码之间没有统一的标准。
虎码的所有字根编码都是由2个字母组成,有时称第一个字母为大码,第二个字母为小码。
如:字根“门”的编码是am
,其中大码是a
,小码是m
。有时也会把大码用大写表示,可以记作Am
。
部分字根举例如下(其中每一行代表了一类字根):
字根 | 编码 | 举例 |
---|---|---|
门 | am |
扪问 |
丨 亅 | gs |
申 |
艹 廾丌艸 | lc |
苦 开戒 鼻艸 |
齿 | lc |
啮 |
字根与编码的关系是多对一的。一个字根只会对应一个编码,而一个编码可能对应多个字根。一个编码除了对应相似的一类字根以外,还可能对应几类不相似的字根。
虎码采用模拟退火算法优化后,字根编码分布显得无章可循,这源于规律分布与其优化目标相悖。
然而,虎码字根编码仍蕴含微妙规律:
- 相似的编码归为了一类,使用相同编码
- 第二个字母可能与字根的读音相关
完整的字根表可以在http://huma.ysepan.com/中下载,也可以在虎码网站上查询。
鉴于字根分布缺乏明显规律,学习并记忆这些字根时,有效利用记忆工具(如间隔重复记忆软件)成为了不可或缺的辅助手段。虎码作者制作了网页版的记忆工具:https://tiger-code.com/practice/base。经过一段时间的练习即可掌握字根编码。
如何输入单个汉字(如何编码?)
虎码的优化目标中有一点就是尽量减少汉字的重复编码。汉字的编码可分为全码和简码。
全码
虎码的单个汉字编码规则是:
首先,按顺序拆分汉字为字根。然后,根据字根数量进行编码:
一个汉字可以按照一定的顺序拆成若干个字根。现在暂时不需要掌握如何拆分汉字。
- 1个字根:输入该字根的前两个字母。
- 2个字根:输入前两个字根的首字母,再输入第二个字根的第二个字母。
- 3个字根:输入前三个字根的首字母,再输入第三个字根的第二个字母。
- 4个字根及以上:输入前三个字根的首字母,再输入最后一个字根的首字母。
可以记为:按顺序输入前三个字根和(如果存在)最后一个字根的第一个字母。若总字母数少于4个,则额外输入最后一个字根的第二个字母。
按照这种规则进行的编码称为全码。
举例如下:
字根数量 | 汉字 | 按照顺序拆分得到字根 | 字根编码 | 汉字编码 |
---|---|---|---|---|
1 | 高 | 高 | gg |
gg |
1 | 九 | 九 | kj |
kj |
2 | 秃 | 禾 几 | xh oj |
xoj |
2 | 难 | 又 隹 | ry ui |
rui |
3 | 华 | 亻 匕 十 | jr vb ns |
jvns |
3 | 博 | 十 甫 寸 | ns nf kc |
nnkc |
4 | 叕 | 又 又 又 又 | ry ry ry ry |
rrrr |
4 | 赝 | 厂 亻 隹 贝 | xc jr ui ob |
xjuo |
11 | 𰻞 | 穴 言 幺 幺 馬 長 長 月 刂 心 辶 | ex sy iy iy nm pc pc vy pd hx uc |
esiu |
简码
为了减少输入字母的数量,一些常用字可以不用输入全部的编码。
简码分为以下几种:
- 一级简码:只需要输入全码的第一个字母。
- 二级简码:只需要输入全码的前两个字母。
- 三级简码:只需要输入全码的前三个字母。
具体哪些汉字有简码,这需要通过不断练习来熟练掌握。
二级简码的优先显示
对于两个汉字A和B,如果一个编码既是A的二级简码,又是B的全码,则输入法会优先显示A,将B放在A的后面。
如:以(vjr, vj),己(vj)。输入vj会优先显示“以”。“己”放在第二位
如果想让B显示在第一位,可以重复输入第二个字母。
如:己(vj)可以输入vjj
如何拆分单个汉字
拆分的方法由编码的设计者决定,不同编码的拆分方法不一定相同。
如:与五笔、郑码不同,虎码有时会将汉字切断为几部分。
拆分汉字的规则可以看虎码网站上的教程,但是要注意的是这些规则只能作为拆分汉字方法的提示来看,具体使用过程中不一定会按照这些规则来进行。最好的方法是利用打字练习工具(如玫枫跟打器等)练习常用字的拆分。
可以利用输入法的拼音反查功能(如fcitx的*
字符)来查询全码。虎码的网站上也提供了编码查询功能。
如何输入词语?
不建议用虎码输入词语,这是因为虎码编码字母数量较少(最多4个)。如果使用少量字母输入词语,很容易出现多个词语对应同一个编码,甚至出现多个反义词同一编码的情况。
学习路线
- 掌握字根的编码
- 练习虎码网站上提供的必拆汉字练习
- 使用打字练习工具(如玫枫跟打器等)练习常用汉字的拆分,提高打字速度