导航

【轉】研制汉字计算机的意义和可能性

Posted on 2013-07-12 18:04  ccjvl  阅读(509)  评论(0编辑  收藏  举报

 

作者: 张时钊 一、什么是汉字计算机 计算机是舶来品,虽然现在它们都能处理汉字,但是都不是汉字计算机,因为那只是使用了已汉化的应用软件而已,但底层软件、操作系统,尤其是BIOS仍是英文的。所以开机时,或软件出现问题的时候,都会出现大量的英文信息,不懂英文的人就会束手无策。我们这里所说的汉字计算机,是指软件的底层,乃至BIOS都已经彻底汉化的计算机,以中文为主,不会出现英文,要用英文反而要进行西化的那种计算机。这样的计算机,没有过,似乎也没有人尝试过。 二、汉字在信息处理中的地位 80年代初,微机初进国门时,普遍认为方块字不能适应信息化,必须淘汰,要推广拼音新文字。83年以前没有有效的汉字输入法,输出的汉字也十分粗糙。这激发了国人开发汉字编码输入软件的热情,一下子出现了几百种乃至上千种的输入法。输入的瓶颈解决了,甚至比英文的输入还快。汉字的打印字形和显示字形也相当漂亮了。30年代开始的推广新文字的工作似乎已失去了意义。相反地,进入90年代后,首先还是由外国人提出这样的看法:未来的世纪将是汉字的世纪。人们发现中文比起英文来确实有大量的优点。 三、中文的优点 经过对比,可以列出以下数条: 1、中文传递的信息量大。同样的文章,中文远比英文短,提高了传输和储存的效率。 2、英文字由字母线性排列而成,汉字则是由笔划组成的二维图形。故阅读中文比英文快。 3、二维的汉字比起一维的英文,结构信息大。故残破的中文比英文容易恢复。 4、英文缩略语太多,既难理解又难记,汉字则相反。 四、研制汉字计算机的意义 既然--汉字比英文优越,未来是汉字的时代,计算机就应该以汉字为基础;汉字输入法未创立前,惊呼汉字会阻碍信息化,要淘汰,汉字输入逐步解决之后,又发现汉字远比英文更适合信息处理。那么--当真正的汉字计算机出现之后,必然会发现汉字有更多的优越性,并推动信息化。 现今世界上使用汉字的人数,比使用英文的人数还多一倍,汉字计算机显然有利于占世界人口1/4的中国人普及计算机。我已经搞了几十年计算机,学了几十年英语,但坐在计算机前还害怕大篇的英文信息。虽然英文应该也会进一步普及,但对绝大多数人来说,总不如母语来得熟练。何况目前90%以上的中国人根本不懂外语,又必须掌握计算机。 五、汉字与英文不同之处 这里限于考虑在计算机信息处理上,即信息的输入、存储、传输、输出上的不同。 英文是由26*2=52个字母及少量标点符号组成,4个二进制位(半个字节、16个状态)装不下,而用一个字节则太多而形成浪费。每一个字母或符号都有用16个字节描述的字模,这些字模已经存在BIOS中,故一开机即可显示英文。汉字一共六万多,现在二级汉字用的是6768个,每个汉字字模至少需要32个字节,共需250K空间,是不可能存在BIOS中的,故开机之初就不能显示汉字。而且,即使使用汉卡或硬字库,即使装的是全部六万多个汉字;因为汉字与一切文字一样是在不断发展的,有可能出现新字,要用新字时必须另时造字,这就不统一,不能流通。 把汉字对应于英文字(词则对应于英文字组)。英文字的元素是字母,则汉字的基本元素应该是笔划。笔划可分为点、横、竖、撇、捺、平捺、提、挑、横(下)折、竖(右)折、横钩、竖钩、斜钩、横折钩、(左)弯钩、右弯钩等16种,刚好用半个字节来表示。问题在于顺序记录的笔划,如何组成一定的二维图形(汉字),它们之间有没有规则可循。 六、研制汉字计算机的可能性 如果能总结出这套规则,按规则编出程序,将线性排列的笔划序列组成二维的汉字,上述意义上的汉字计算机就可以造出来了。16种笔划,即使每个笔划又提供宋体、楷体、隶书、黑体等六七种字体,也不会比英文计算机的字模容量大,完全可以在BIOS中存储下来。一旦BIOS编好,按这新的BIOS运行时,就成为汉字计算机了。 这样的规律是可以研制出来的。1984年,我选用240个汉字的字根(偏旁部首),发现它们的组字规则,少数不能用规则概括的使用4个组字符号,就可以写出所有已有的汉字,还可创造出尚不存在的方块字来。如果仍以这些字根为基础,每个字根以其首尾笔划编码,这样就可以只用数字小键盘的16个键输入笔划而组出汉字来了。当时的程序是在袖珍机PC-1500上开发出来的,连字模带程序只有8K,字形不很好看。现在如果多开销一些存储空间和研制时间,我相信会逐步完善的。 七、研制的步骤 现在面对的是已经十分复杂的微机系统,人们的要求也远比过去高,研制汉字计算机远不是一两个人,在短期内所能完成的,要使它真正成功并推广,要解决的问题之多还不能完全估计到。初步设想要有以下几个方面: 1、首先使用方便的高级语言,如VB,建立起无字库的汉字系统。要字形漂亮,还需要学习掌握已有的矢量字模的生成技术。无字库汉字系统满意之后,再用汇编语言改为更加简洁有效的软件。 2、选择一种不会有版权纠纷的BIOS进行解读,然后用无字库汉字系统取代原有的英文系统。 3、解读操作系统,并将其修改为汉字的(包括命令字)。为开发容易及避免版权纠纷起见,可只选择LINUX。 4、要使修改的操作系统仍能支持所有软件,要逐一研究常用的高级语言和应用软件。同时要开发大量新的软件来支持它,这一工作是无止境的。 以上4方面应同时分工进行,且每方面都可用几拨人,以确保成功。