数据化运营(1)

    前段时间,boss推荐<数据挖掘与数据化运营实战:思路、方法、技巧与应用>,买来看了一下,觉得里面有很多干货,尽管有关怎么建模,如何建模等深入到算法层面的东西讲的比较少,但是该书站在商业化,业务+技术的角度阐释了该如何做数据挖掘,以下我是用思维导图的方式记录了的笔记(直接从云笔记里面copy过来)

第三章 常见数据分析模型
 
 
第四章 数据化运营是跨专业、跨团队的合作
第五章 主要谈到新手数据分析师常见的错误观念
1,轻视业务;2,技术万能;3,技术尖端;4,机器万能;
总的来说要紧密结合业务挖掘有价值的东西。平常思考过程中别把关联关系转化成因果关系
第六章 一个完整的挖掘案例流程
 
第七张章 挖掘模型优化跟评价指标
第八章 常见数据处理技巧
在数据挖掘领域一个很经典的话是:Garbage In,Garbage Out! 通常一个挖掘任务70%的时间都花在建模前期的工作中。
第九章 聚类分析的应用
聚类概念 啪啦啪啦一堆(就不写啦,各种谷歌度娘得到结论)。。。。
聚类分析技术的常见应用场景
聚类算法的种类也是多种多样,常用的K均值(k++均值),层次聚类(较慢),谱聚类(基于图结构的),LDA(主题模型,文本类)
运用聚类分析可能遇到的问题
1,数据噪声和离群值
     处理方法:删除或者抽样。
2,数据标准化或者归一化(防止个别数值很大的属性权重大)
3,距离公式(欧氏、马氏、汉明等等)

 

posted @ 2014-02-13 17:13  kobeshow  阅读(1562)  评论(0编辑  收藏  举报