Pixysoft.Framework.Noebe.Datamining 数据挖掘开发实录
简单的计划
1. 熟悉SSIS
2. 查看关于数据挖掘的一些论文,掌握简单的核心算法
3. 了解一些关联算法(程序员提到的) ,还有一些推荐算法,是否通用
4. 如何集成数据流在数据挖掘(流的筛选和合并)
5. 确定采用的方式:a。xml的增量记录;b。时间戳记录+原始数据库来回的选择
6. 思考数据挖掘与财务系统、现有系统的关系,设计通用框架
7. 实现原型系统
8. 实际系统的部署与使用
开发时间:
1-3,大概1个星期内完成
4、6,大概1天
7、8,大概半个星期
合计:14天左右。
开始时间2009-12-14
结束时间2010-01-05
合计:20天。算慢了。
其实数据挖掘太tmd简单的,就是表拆分,所谓olap估计就是拼sql。真是非学术的人在装b,搞一大堆名词,还不如一个简单的数学公式。