#数据挖掘与数据化运营实战#2.3数据挖掘技术以及在数据化运营中的应用
编号 |
数据挖掘技术 |
应用 |
算法 |
优势 |
劣势 |
1 |
决策树(Decision Tree) |
用户划分、行为预测、规则梳理 |
CHAID |
1、决策树的构造不需要任何领域的知识,很适合探索式的知识发掘,并且可以处理高维度的数据 |
|
2 |
神经网络 |
用户划分、行为预测、营销响应 |
反馈传播 |
1、自适应性、自组织性和高容错性,并且具有较强的学习、记忆和识别功能 |
1、知识和结果的不可预测性 |
3 |
回归 |
预测、分类、"二选一"事件 |
逻辑回归 |
1、很好地回答预测、分类等数据化运营中常见的分析项目主题 |
|
4 |
关联规则 |
推荐 |
Apriori算法 |
|
|
5 |
聚类 |
用户划分;可以作为数据探索的工具,包括发现离群点、孤立点,数据降维的手段和方法,通过聚类发现数据间的深层次的关系等 |
划分的方法(K-Means) |
|
|
层次的方法 |
|||||
基于密度的方法 |
|||||
基于网格的方法 |
|||||
基于模型的方法 |
|||||
6 |
贝叶斯分类方法 |
分类问题的归类等应用场景 |
朴素贝叶斯 |
|
|
7 |
支持向量机 |
预测、分类 |
|
1、对于复杂的非线性的决策边界的建模能力高度准确,并且也不太容易过拟合 |
1、训练数据较大 |
8 |
主成分分析 |
数据处理、降维、变量间关系探索 |
|
|
|
9 |
假设检验 |
运营效果评估 |
|
|
|