数据&信息到底是啥?

1、什么是数据?

“数据”是一个很简单的词汇。

  • 100、101、102…
  • 阴、雨、下降、气温……
  • 红烧肉、黄焖鸡米饭、麻辣烫……
  • 学生的档案记录、货物的运输情况
  • 😄、😃、😅……

可以发现:

数据是对客观事物的符号表示。

显然,数据的表现形式还不能完全表达其内容,需要经过 解释 ,数据和关于数据的解释是不可分的。
例如,102是一个数据,可以是一个同学某门课的成绩,也可以是某个人的体重,还可以是中午食堂吃麻辣烫的人数,😅表情表示了我在这时候很无语。
因此:

  • 数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
  • 数据经过处理就成为信息。

2、什么是信息?

image

就拿水来作为一个例子吧,对于一杯水而言,它的属性是无限多的,比如,水的体积、温度、密度、透明度、颜色……也有很多数据:20、36、1、透明、

这些属性是客观存在的,就是说如果这杯水的温度是36度,就算没有人去观察这杯水,它的温度也还是36度,而“水的温度是36度”只是这杯水的众多信息之一。
(这个概念对于学过哲学唯物内容的同学来说,是比较好理解的😏)

2.1、信息的概念

下面,我们来看点其他的说法。 “信息”一词在英文、法文、德文、西班牙文中均是“information”,日文中为“情報(じょうほう)”,我国台湾称之为“资讯”,我国古代用的是“消息”。

控制论创始人维纳(Norbert Wiener)认为“信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容和名称”,(即人与外部世界的交换内容,称为信息)。

信息奠基人香农(Shannon)认为“信息是用来消除随机不确定性的东西”。

相比较来看,香农对于信息给出了一个更广义的解释:
因此我们可以再换个说法,

在一种情况下,能减少不确定性的任何事物,都可称为信息
也就是说
信息就是不确定性的消除

对于这个解释其实不难理解,我主要提一下,其中我们容易困惑的点。

接收到的信息,是相对于观察者对事件已有的实际了解程度而言的,也就是说, 如果我们本身已经知道某件事,那么别人再告诉我们这件事,此时的信息量为0。想想看,当我们知道的越多,对这件事的不确定是不是就越少了?

综上,我们可以得出一个定义,信息是物质存在的一种方式、形式或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息的所描述事件的不确定性减少。

2.2、信息与消息

别担心,信息虽然是不确定的,但我们可以从真实案例归纳出信息的特点。

⭐比如说,现在有两条消息⭐

  • 中国男子乒乓球队获得世界冠军
  • 中国男子足球队获得世界冠军

显然,这两条信息发生的概率完全不同,一个接近1,一个几乎为0(😇),那么哪条信息包含的信息量大呢?

点击查看
答案是第二条

这也就说明:

  1. 消息发生的概率P(x)越大,信息量越小;反之,发生的概率越小,信息量就越大。
  2. 当概率为1时,百分百发生的事,地球人都知道,所以信息量为0。
  3. 当一个消息是由多个独立的小消息组成时,那么这个消息所含信息量应等于各小消息所含信息量的和。

(所以大家知道为什么第二条信息量更大了吧✋👐🏃)


2.3、信息的五点特征

通过我们刚刚举例的一杯水💦,我们可以提取出信息的基本特征。

信息的特征 描述 举例 概括
载体依附性 - 信息是不能独立存在的,必须依附于一定的载体。
- 同一信息也可以依附于不同的载体,因此获取信息的途径和方法也不同。
-36度,必须依附于这一杯水,才能有它具体的意义:这杯水的温度是36度。
-36度,如果依附人体,则它的意义可能是:人体的体温是36度。
任何信息总是客观地反映某一事实,从本质上说,信息是附属于事实的,离开了事实也就失去了意义。
共享性 - 信息是可以共享的。
- 同一种信息可以同时被不同接收者获取,人们也可以重复利用信息。
- 信息不会因为被别人获取而发生损耗。
- 我可以拿起一杯水告诉全班:这杯水是36度!
- 全班也可以对我说:人的体温也是36度!
- 这两条信息当然不会因为被说出来而消失。
没有传递就没有信息,更谈不上信息的效用。
时效性 信息往往反映的是事物某一特定时间内的状态,他会随着时间段的推移而变化。 - 一杯水不可能永远是36度,
- 人体也不可能是一直完全正好的36度。
信息的效用有一定的期限。一旦超过期限,效用就会减少,甚至丧失。
可加工处理性、真伪性 信息是可以加工处理的。 我可以告诉你这杯水里面加了白糖,还可以告诉你它是一杯生水,至于它到底是不是……你觉得呢? 信息经过加工处理分析后,可以更好地被人们利用。
价值性 - 包含显性价值和隐性价值。
- 显性价值是从直接获得的信息中做出行动。
- 隐性价值则是除开信息内容外的价值。
- 这杯水36度,属于凉开水,可以直接喝。
- 每天喝水有益于身体健康。
- “这杯水36度”对于不想喝水的人,价值相当于0。
信息的价值是相对的。

3、数据、信息、知识、智慧

与信息相关,或是相混淆的,有数据、知识以及智慧等概念。

我们已经知道,数据是指那些记录客观事物的、可鉴别的符号(包括数字、文字、图形等等)。通常我们的信息都是从数据中提取出来的,经过解释对提取出来的数据赋予意义。

而知识的解释有很多,从哲学的角度:

知识是人们在认识世界、改造世界中获得的认知、经验的综合。

一个经典的定义来自于柏拉图:一条陈述能称得上是 知识 ,必须满足三个条件:它一定是被验证过的,正确的,而且是被人们相信的。

智慧就比较高级了,我们通常对智慧有一个误解,认为一个人学得知识越多,他就越有智慧。
(我们最爱的填鸭式教育是这个误解的生动体现😇)
根据智慧的字面来理解,智:知识。慧:灵性。因此:

智慧是人基于知识所做出的推理、判断和主张。

所以说有了知识不代表有了智慧,要通过对那些知识的运用才能形成智慧。

4、大数据

数据量大不一定就是大数据。它需要符合四个特征,简称为4个V:

  • 数量(Volume)
    • 数据体量巨大:量级单位从TB、PB跃升至EB、ZB级别。(1 EB=260 B):一本《红楼梦》约有87万字(含标点),每个汉字占两个字节,即1个汉字=2B,由此得出 1EB ≈ 6626亿部《红楼梦》;
  • 速度(Velocity)
    • 速度快:数据产生速度快(微博、微信,每个人产生的少,但用户多,产生的量很大)、数据处理速度快;
  • 多样(Variety)
    • 数据类型多;
  • 价值(Value)
    • 价值密度低:密度=质量/体积。 数据量过大,能发挥价值的知识其中非常小的一部分。如某起刑事案件的监控录像,连续不间断的监控视频,嫌疑人出现在视频中的有效部分仅仅只有几秒钟,大量不相关信息会增加获取有效数据的难度。

参考资料

本文作者:HERSHY2331

本文链接:https://www.cnblogs.com/windy2331/p/18576104

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   HERSHY2331  阅读(24)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起