输人法简介

常见的输入方法有语音输入、手写输入还有每天都在使用的键盘输入方法等等,这里单独将键盘输入法拎出来简单介绍。计算机最早在西方国家出现,起初的键盘设计是为了应对字母文字的输入需求,每一个字母都有对应的按键如:英语的26个字母。后来计算机传入了中国我们要解决汉字的输入问题,而且为了利用现有的计算机硬件,我们需要在原来的键盘布局上做出改进。而常用的键盘有局就是美式键盘。

汉字数量众多,现在收录入电脑的字数已超过 9 万,要使用这有限按键录入所有的汉字就需要有一套汉字录入方案。最先能想到的方法是直接使用汉语拼音,这是因为我们基本都学过汉语拼音。我们发现汉语拼音与英文的 26 个字母之间只有一点差别。汉语拼音中有 ü 而 26 个字母中没有。26 个字母中有 v ,但汉语拼音中没有 v。我们可以用 v 代替 ü 。这样就可以用键盘的 26 个键输入所有的汉字了——这就是全拼输入法。

全拼输入法初步解决了汉字输入的问题,但是输入一个字都需要完整地输入汉字的拼音,效率太低。为了解决这个问题,我们开始尝试提出一种拼音的替换方案——双拼。这里给出B站上视频,双拼是什么。

了解了什么是双拼,那么怎样用什么字母来表示声母和韵母就会有不同的方案。这也就是不同的双拼方案了,现在主流的双拼方案:

双拼输入方案的出现极大地提高了汉字的输入效率。除了全拼,双拼还有一种更简单的拼音方案简拼——即用每个汉字拼音中的第一个字母来代替该汉字的输入方法。这种方案是够简单但重码率也非常高,平时输入特的常用词语还可以,一旦输入的汉字多起来了这种方案就不适用了。所以简拼只能是一种临时替代全拼提高输入的效率的一种方案。但是有一个问题。无论是全拼还是双拼在输入汉字时都必须知道汉字是如何发音的。如果要输入不知道怎么发音的汉字怎么办?如:𣊫、朤,𨰻,𣡕,叕,燚,㙓,𥷹……这时候就需要另一套的输入方案了——字形输入。通过观察可以将汉字分为独体字、合体字。独体字是直接以笔画构成的汉字,合体字通常是由两个或两个以上的形体组成,同时独体字大部分又是合体字的构成部件。独体字又可以分为基本的形体,由此就可以通过用键盘上的字母来表示不同的形体,通过形体来输入汉字了。如:“𣊫”可以输入 4 个“日”;“朤”可以输入 4 个“月”……。如何对汉字进行拆分,用什么按键对应不同的形体这些方案的确定形成了不同的字形输入方案,常见的的字形输入方案有:

输入方案有了,我们可以用 26 个英文字母的组合来对每一个汉字进行编码了。但是还有一个问题需要解决,当我们输入了一串英文字母组合后我们如何让计算机知道我们想要输入汉字?我们需要一个中间的翻译,把我们输入的一串字母组合翻译为对应的汉字。这一个功能的实现就是输入法平台需要做的事情了,汉字编码方案 + 输入法平台两者的组合解决了计算机汉字输入的问题。现在来看一下流行的输入法平台有哪些:

汉字输入的目标是快速、准确地输入汉字,拼音编码方案和字形编码方案分别从汉字的发音和字形上来解决这个问题。字形输入法采用的是优化编码方案,以减少重码。重码是指同样的输入会出现好几个汉字。王码五笔的从 86 版到 98 版再到新世纪版,除了优化键位以使长时间打字手不易疲劳,还有重要的一点就是减少重码。拼音编码方案则采用辅助码、词库、整句输入的办法,也就是把常用词、句子输句保存下来。当检测到对应的输入后直接显示一个词或一句话。这也是为什么用搜狗输入法的拼音输入时间越长越感觉它好用的原因,这是因为用的时间越长用户的输入习惯、常用词、句已被软件存储的原因。此外还有一个提高效率的方法是关联,比如输入一个字、词后面会出现与之搭配的词。输入一串拼音,生成一句话。每个拼音对应哪一个汉字根据上一个拼音来确定。也就是常说的二元模型、三元模型,二元模型是指所出现的字或词只与前一次的输入有关,三元模型是指所出现的字或词与前二次的输入有关。现在大多输入法平台用的是二元模型,搜狗云输入用了三元模型。一般来说模型越高,输入的准确性越好,但也和输入法的具体实现有很大的关系。这里说点题外话,为什么搜狗输入法那么好用?有很大程度是用的人多,有大量的语料被收集起来进行分析,以用来优化词库、训练输入模型。

最后总结:什么样的输入法是好用的,请参考好输入法的特点自行选择。

  1. 易学、好用。为什么我们很多人刚开始的时候喜欢用拼音输入法,原因是因为我们在学校时学过拼音。但这并不意味着拼音就好学了,想想当时花了多久才学会拼音的。使用全拼输入法固然是易学了,因为之前有基础。但是好用却是未必的了,重码率高。输入慢就是很大的问题。
  2. 保护眼睛。想想吧如果一中输入法你需要一直盯着候选框来选字,或者是自动联想的句子错字很多,这在平时与人聊天还凑合,一旦认真起来后期再校对真的对眼睛是莫大的伤害。
  3. 支持大字集输入。常用字7千左右,之前大字集为2万左右,现在要求在 9 万左右的大字集输入。
  4. 很好地解决符号输入。要能比较好地解决符号输入的问题。
  5. 能拿回自己的输入数据。近些年某些输入法软件将用户输入的数据当作了自己的数据,当用户想拿回自己的输入数据时如词库非常困难,甚至是不能拿到。所以在选择输入法时这一方面也要考虑。否则换了一台设备再次开始输入将十分的不方便。
  6. 其它,一个输入法软件一会蹦出个单窗广告,一会安装自家的浏览器……这样的输入法肯定不是用户想要的吧。
posted @ 2021-09-18 21:06  偊偊而步  阅读(308)  评论(0编辑  收藏  举报