01 数据分析与挖掘概述
1. 数据分析与数据挖掘的区别
- 定义
- 数据分析:描述和探索性分析,评估现状和修正不足
- 数据挖掘:技术性的采矿过程,发现未知的模式和规律
- 侧重点
- 数据分析:实际的业务知识
- 数据挖掘:挖掘技术的落地,完成采矿过程
- 技能
- 数据分析:统计学,数据库,excel,可视化等
- 数据挖掘:过硬的数学功底和编程技术
- 结果
- 数据分析:需结合业务知识解读统计结果
- 数据挖掘:模型或规则
2.数据挖掘的流程
- 明确目标
- 数据搜集
- 数据清洗
- 构建模型
- 模型评估
- 应用部署
3. 常用的数据分析与挖掘工具
- r语言
- python
- weka : 一款公开的数据挖掘平台
- sas : 统计分析软件 (收费)
- spss : 世界上最早的统计分析软件 (收费)