数据挖掘(一) 什么是数据挖掘
数据挖掘定义:
数据挖掘是从大量的,不完全的,有噪声的,模糊的,随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。
数据挖掘涉及到的知识:
数据库技术、统计学、可视化、高性能计算、人工智能、机器学习
关于数据、信息、知识的理解:
也就是说 : 对于一个客户:它的年龄25岁,收入10万中的25、10就是数据(单独说25,10我们是不知道它是啥意思的)
我们知道了一个年龄38岁,收入7万,工作12年的良性用户,这便是得到了一条信息(不但包含数据,还包括了一些解释,我们知道它表达的意思)
最后我们可以得出一条结论:25 < 年龄 < 30, 收入 > 10,工作时间 > 2年的消费者是优质顾客(这便是我们通过“学习“ 数据、信息得到的知识)