数学基础课--《看数学之美后的随想》(二)信息的产生。

那么,我们就从最远古的时代说起,在古代的时候,人们只需要通过较少的语言进行沟通就好。就如在《乡土中国》所说,在一个小的村落中,我们的习俗已经被定义好了,以及人们与人的交流方式也已经进行了定义。

语言的产生

比如,在古代的村落中,一位原始人A像另一位原始人B,说看那边有个美女。可能就是“呀呀”两句,而另一个原始人回复“呀呀呀”的意思可能就是我们去追她吧。

而这里面 信息的传输和传播 与我们今天的信息论 有着一样的模型。 如下图所展示的。

 

随着村落的扩大,人们需要交流更多的事情了。以及要把一些好的经验流传下来。这个时候,最重要的事情就是,文字的出现

我们这时候将目光移到东非大陆,在5000年前到10,000年前的最初的信息革命时代的到来,那里便是如今的人类文明的摇篮。

在中国最早的甲骨文大约发现在 3200年前的 殷墟时代, 而在西方的尼罗河流域,古埃及人就已经出现了高度的文明。而他们也发明了最早的信息的保存形式。即我们最容易想象到的,用图像画出来。

即 这就是最早的象形文字。

然而象形文字在起初是足够使用的,但是当人们所想表达的事情,越来越多。人们就会不断的画出,创造出合适的图像,或者新的象形文字。

终于,当文字到达一定量的时候,人们已经无法记住所有的象形文字了。这时候就产生了文字的聚类现象

比如中国的甲骨文中,“日”这个字,即代表了太阳,又代表了太阳从日出到日落的周期,即我们所说的白天。  而这些 跟我们如今的自然语言的处理 或者机器学习有着很大的想通性。但是在古时候可能需要几百年甚至几千年,而现在 我们只需要短短几天。

但是,当一个文字代表了多种的意义的时候,就会产生一种歧义性。  比如,我单单像你说个 字 “日”, 就会让人产生误解。  到底指的是太阳呢?一个白天呢?  或者你可能直接过来打我。

而我们去解决这类事情的办法 通常都是通过上下文去解决的。而通常我们就使用这种方法,消除了大量的歧义性。

但是,有一点,文明的消失是一种常态。(中国的文明 是一个特例)。 

所以当文字无法进行流传的时候,就产生了文明之间的差异。或者因为地域,或者因为历史,或是因为战争,不同的文明相互发展,之后便拥有了不一样的文字。

而人类之间的交流会因为战争冲突的到来,形成一种融合,而这个时候,我们便需要翻译出马了。

而翻译为什么能达成?  还记得我们第一篇所说的吗? 因为各个国家的语言,其实都遵从着同一套科学规律。

或者可以这样说:

翻译这件事之所以可以达成,仅仅是因为不同的文字系统在记录信息的能力上是等价的。

再公元前7世纪,随着希腊人卷入了埃及人的政权,希腊文化开始对埃及产生了影响,尤其后来的罗马人,马其顿人 成为了埃及的主任,象形文字开始了拉丁化。而到了公元4世纪左右,罗马皇帝迪奥多西一世下令清楚非基督教的宗教,埃及的象形文字就此失传。

而在1400多年后,拿破仑的远征军来到了埃及,在一个罗塞塔的地方发现了著名的罗塞塔石碑。上面有三种文字:埃及的象形文字,埃及的拼音文字和古希腊文。然而随行的科学家让·约瑟夫·马塞尔对石碑进行了拓印。然而一直到1822年,法国语音学家商博良才破解了石碑上的古埃及象形文字。

而这件事情对我们的自然语言处理又有什么关系呢?

1. 信息的冗余。  我们得感谢古代的学者将一件事情 用三种文字记录了下来。这样我们才能得知2000年前的历史。 而这跟我们现在的信道编码,有着指导的意义。

2. 语言的数据,我们称之为语料。尤其是双语或者多语 的对照语料。

这也就是为什么如今的大多翻译器或者服务器,我们都会用“罗塞塔”命名的原因了。

而 数字是否可以作为这样的载体呢?  答案是肯定的。这也是现代通信的基础。

数字的产生

如果说文字的出现是因为远古的“信息爆炸”,那么数字的出现 则是因为人们财富的积累。

著名的美籍俄裔数学家,乔治·伽莫夫在他的科普读物中《从一到无穷大》中说到一个故事。

两个酋长要比一比谁说的数字大,一个酋长想了想 说了数字三。第二个酋长想了半天,也没有说出比三大的数字。这是因为在古代的原始社会,物质的缺乏,人们很少会用到比三大的数字,而三代表的就是许多。

就犹如中国古代会用九天来代表很高。

而我们的祖先,在财产的积累下,发现了5和8 其实是有区别的,这时候计数系统 便应运而生了。 而数字便是计数系统的根基。

然而早期的我们使用数字最简单的方式,便是数指头。

当然了,我们的祖先发现十个手指头是不够用的,那么怎么办呢? 加上脚趾头吧。  当然我们的祖先没有那么笨,便发明了进制。 而为什么我们的祖先大多用的是十进制,那是因为我们有10跟手指头。如果我们有十二根的话,可能现在就是十二进制了。

而有没有文明是二十进制了? 就是要数完手指和脚趾才进位呢?  当然有了,就是玛雅文明。因此玛雅人的一个世纪 ,他们称之为太阳纪,是400年。  所以2012年便是玛雅文明这个太阳纪的最后一年。 但是为什么被传为世界末日,就不得而知了。

posted on 2019-08-25 18:32  哆啦任意门  阅读(454)  评论(0编辑  收藏  举报

导航