2016年5月30日

摘要: 由于篇幅的问题,不得不将一篇文章分三个随笔来写。而本文承接前面两篇文章《跨行业数据挖掘标准流程(上)》、《跨行业数据挖掘标准流程(中)》。欲了解前两篇文章,请参考下面的链接: 《跨行业数据挖掘标准流程(上)》:http://www.cnblogs.com/ljy2013/p/5542961.html 阅读全文
posted @ 2016-05-30 16:56 ljy2013 阅读(295) 评论(0) 推荐(0) 编辑
 
摘要: 四、数据准备 在对数据进行充分理解的基础上,我们就要生成能够满足数据挖掘需要的数据宽表。在此阶段,我们需要集中精力在数据准备上,往往一个项目超过60%的时间都放在数据理解和数据准备上面。你以为剩下的40%是建模分析?其实10%才是建模分析,剩下的30%都是用来吐槽数据质量问题的。因为在上面已经简单讨 阅读全文
posted @ 2016-05-30 16:45 ljy2013 阅读(423) 评论(0) 推荐(0) 编辑
 
摘要: 一、说明 在实践当中,一个数据挖掘项目(或者说在咱们企业内部中一个分析研究主题),不但周期长,常常还会跨数据源,甚至跨部门协助进行,稍不留神就会陷入复杂的数据迷宫当中。为了能够在整个项目阶段能够保持研究重点,能够持续跟踪,一个有效的数据挖掘方法论(明确的流程模型)是非常有必要的。 商业应用的数据挖掘 阅读全文
posted @ 2016-05-30 16:40 ljy2013 阅读(1264) 评论(0) 推荐(0) 编辑