摘要: 项目正式开始时间:2015.10.15. 随笔内容:本次项目的主题是基于Spark的ML。对于ML的学习有大概半年了,正好在网上关注到了由上海交通大学所主办的这个飞谷云的大数据项目,我所报名的这期已经是飞谷云的第六期了,在网上和群里了解了一段时间后大算报名参与一次,毕竟之前没有参与过真正的项目开发... 阅读全文
posted @ 2015-10-19 20:59 闷头雪IT 阅读(1038) 评论(6) 推荐(0) 编辑
摘要: ·什么是数据仓库?数据仓库(一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于企业或组织的决策分析处理)。·数据仓库的结构和建立过程:数据源(Sq,文档,其他)-----抽取、转换、装载----> 数据存储和管理--------->数据仓库引擎-------->前段展示·什么是Hiv... 阅读全文
posted @ 2015-10-19 19:20 闷头雪IT 阅读(148) 评论(0) 推荐(0) 编辑