读书笔记 第2章 数据挖掘概述

第2章 数据挖掘概述

标签(空格分隔): 数据化运营


2.1 数据挖掘发展史
2.2 数据分析与数据挖掘的主要区别
2.3 数据挖掘的主要成熟技术以及在数据化运营中的主要应用
2.4 互联网行业数据挖掘应用的特点

2.1 数据挖掘的发展史

始于20世纪下半叶
发展 1989年第11届国际人工智能联合会议 首次出现KDD(knowledge discovery in database)
进入21世纪,数据挖掘作为比较成熟的交叉学科,融合了数据库、人工智能、机器学习、统计学、高性能计算、模式识别、神经网络、数据可视化、信息检索和空间数据分析等多个领域的理论核技术。

2.2 统计分析和数据挖掘的主要区别

两者在很多情况下都是同根同源的。
相对于传统的统计分析技术,数据挖掘有以下特点:

  1. 数据挖掘特别擅长处理大数据
  2. 数据挖掘在实践中一般会借助数据挖掘工具
  3. 数据挖掘技术更多的是企业数据分析师、业务分析师在使用,而不是统计学家。
  4. 数据挖掘是统计分析技术的延伸和发展。
    数据挖掘与统计分析的明显差别:
  5. 统计分析的基础之一是概率困,在分析时,需要对数据分布和变量间的关系做假设而数据挖掘会自动寻找变量之间的关系。
  6. 统计分析在预测中长表现为一个或一组函数的关系式,数据挖掘在预测应用中的重点在于预测的结果,很多时候不会产生明确的关系式。
  7. 实践应用中,统计分析常需要分析人员先做假设或判断,然后利用数据分析技术来验证该假设是否成立。数据挖掘让算法自己去寻找数据中隐藏的关系或规律。
    统计分析与数据挖掘 ,有价值才是最好的。

2.3 数据挖掘的主要成熟技术以及在数据化运营中的运用

决策树
神经网络
回归
关联分析
聚类
贝叶斯分类方法
支持向量机
主成份分析
假设检验

2.4 互联网行业数据挖掘应用的特点

数据海量
分析周期段
分析失效性明显变短
互联网行业的颠覆性迅速、周期短

posted @ 2016-04-15 01:02  li_volleyball  阅读(266)  评论(0编辑  收藏  举报