数据&信息到底是啥?
1、什么是数据?
“数据”是一个很简单的词汇。
- 100、101、102…
- 阴、雨、下降、气温……
- 红烧肉、黄焖鸡米饭、麻辣烫……
- 学生的档案记录、货物的运输情况
- 😄、😃、😅……
可以发现:
数据是对客观事物的符号表示。
显然,数据的表现形式还不能完全表达其内容,需要经过 解释 ,数据和关于数据的解释是不可分的。
例如,102是一个数据,可以是一个同学某门课的成绩,也可以是某个人的体重,还可以是中午食堂吃麻辣烫的人数,😅表情表示了我在这时候很无语。
因此:
- 数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。
- 数据经过处理就成为信息。
2、什么是信息?
就拿水来作为一个例子吧,对于一杯水而言,它的属性是无限多的,比如,水的体积、温度、密度、透明度、颜色……也有很多数据:20、36、1、透明、
这些属性是客观存在的,就是说如果这杯水的温度是36度,就算没有人去观察这杯水,它的温度也还是36度,而“水的温度是36度”只是这杯水的众多信息之一。
(这个概念对于学过哲学唯物内容的同学来说,是比较好理解的😏)
2.1、信息的概念
下面,我们来看点其他的说法。 “信息”一词在英文、法文、德文、西班牙文中均是“information”,日文中为“情報(じょうほう)”,我国台湾称之为“资讯”,我国古代用的是“消息”。控制论创始人维纳(Norbert Wiener)认为“信息是人们在适应外部世界,并使这种适应反作用于外部世界的过程中,同外部世界进行互相交换的内容和名称”,(即人与外部世界的交换内容,称为信息)。
信息奠基人香农(Shannon)认为“信息是用来消除随机不确定性的东西”。
相比较来看,香农对于信息给出了一个更广义的解释:
因此我们可以再换个说法,
在一种情况下,能减少不确定性的任何事物,都可称为信息。
也就是说
信息就是不确定性的消除
接收到的信息,是相对于观察者对事件已有的实际了解程度而言的,也就是说, 如果我们本身已经知道某件事,那么别人再告诉我们这件事,此时的信息量为0。想想看,当我们知道的越多,对这件事的不确定是不是就越少了?
综上,我们可以得出一个定义,信息是物质存在的一种方式、形式或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息的所描述事件的不确定性减少。
2.2、信息与消息
别担心,信息虽然是不确定的,但我们可以从真实案例归纳出信息的特点。
⭐比如说,现在有两条消息⭐
- 中国男子乒乓球队获得世界冠军
- 中国男子足球队获得世界冠军
显然,这两条信息发生的概率完全不同,一个接近1,一个几乎为0(😇),那么哪条信息包含的信息量大呢?
点击查看
答案是第二条
这也就说明:
- 消息发生的概率P(x)越大,信息量越小;反之,发生的概率越小,信息量就越大。
- 当概率为1时,百分百发生的事,地球人都知道,所以信息量为0。
- 当一个消息是由多个独立的小消息组成时,那么这个消息所含信息量应等于各小消息所含信息量的和。
(所以大家知道为什么第二条信息量更大了吧✋👐🏃)
2.3、信息的五点特征
通过我们刚刚举例的一杯水💦,我们可以提取出信息的基本特征。
信息的特征 | 描述 | 举例 | 概括 |
---|---|---|---|
载体依附性 | - 信息是不能独立存在的,必须依附于一定的载体。 - 同一信息也可以依附于不同的载体,因此获取信息的途径和方法也不同。 |
-36度,必须依附于这一杯水,才能有它具体的意义:这杯水的温度是36度。 -36度,如果依附人体,则它的意义可能是:人体的体温是36度。 |
任何信息总是客观地反映某一事实,从本质上说,信息是附属于事实的,离开了事实也就失去了意义。 |
共享性 | - 信息是可以共享的。 - 同一种信息可以同时被不同接收者获取,人们也可以重复利用信息。 - 信息不会因为被别人获取而发生损耗。 |
- 我可以拿起一杯水告诉全班:这杯水是36度! - 全班也可以对我说:人的体温也是36度! - 这两条信息当然不会因为被说出来而消失。 |
没有传递就没有信息,更谈不上信息的效用。 |
时效性 | 信息往往反映的是事物某一特定时间内的状态,他会随着时间段的推移而变化。 | - 一杯水不可能永远是36度, - 人体也不可能是一直完全正好的36度。 |
信息的效用有一定的期限。一旦超过期限,效用就会减少,甚至丧失。 |
可加工处理性、真伪性 | 信息是可以加工处理的。 | 我可以告诉你这杯水里面加了白糖,还可以告诉你它是一杯生水,至于它到底是不是……你觉得呢? | 信息经过加工处理分析后,可以更好地被人们利用。 |
价值性 | - 包含显性价值和隐性价值。 - 显性价值是从直接获得的信息中做出行动。 - 隐性价值则是除开信息内容外的价值。 |
- 这杯水36度,属于凉开水,可以直接喝。 - 每天喝水有益于身体健康。 - “这杯水36度”对于不想喝水的人,价值相当于0。 |
信息的价值是相对的。 |
3、数据、信息、知识、智慧
与信息相关,或是相混淆的,有数据、知识以及智慧等概念。
我们已经知道,数据是指那些记录客观事物的、可鉴别的符号(包括数字、文字、图形等等)。通常我们的信息都是从数据中提取出来的,经过解释对提取出来的数据赋予意义。
而知识的解释有很多,从哲学的角度:
知识是人们在认识世界、改造世界中获得的认知、经验的综合。
一个经典的定义来自于柏拉图:一条陈述能称得上是 知识 ,必须满足三个条件:它一定是被验证过的,正确的,而且是被人们相信的。
智慧就比较高级了,我们通常对智慧有一个误解,认为一个人学得知识越多,他就越有智慧。
(我们最爱的填鸭式教育是这个误解的生动体现😇)
根据智慧的字面来理解,智:知识。慧:灵性。因此:
智慧是人基于知识所做出的推理、判断和主张。
所以说有了知识不代表有了智慧,要通过对那些知识的运用才能形成智慧。
4、大数据
数据量大不一定就是大数据。它需要符合四个特征,简称为4个V:
- 数量(Volume)
- 数据体量巨大:量级单位从TB、PB跃升至EB、ZB级别。(1 EB=260 B):一本《红楼梦》约有87万字(含标点),每个汉字占两个字节,即1个汉字=2B,由此得出 1EB ≈ 6626亿部《红楼梦》;
- 速度(Velocity)
- 速度快:数据产生速度快(微博、微信,每个人产生的少,但用户多,产生的量很大)、数据处理速度快;
- 多样(Variety)
- 数据类型多;
- 价值(Value)
- 价值密度低:密度=质量/体积。 数据量过大,能发挥价值的知识其中非常小的一部分。如某起刑事案件的监控录像,连续不间断的监控视频,嫌疑人出现在视频中的有效部分仅仅只有几秒钟,大量不相关信息会增加获取有效数据的难度。
参考资料
本文作者:HERSHY2331
本文链接:https://www.cnblogs.com/windy2331/p/18576104
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步