java程序员-http://www.it-ebooks.info/

年轻的我,脚踩大地,仰望天空,路还很长....

博客园 首页 新随笔 联系 订阅 管理

1、熟悉linux操作,包括常见的命令

2、了解学习vmware的一些高级的使用场景

3、做了一年的基于rdms数据仓库的开发、ETL工具的开发,彻底了解CUBE的计算过程,同时与分布式里面的hive、kylin原理的理解

4、安装使用分布式计算引擎、包括hadoop、spark、storm、kakfa、fluem生态系统的环境打架以及使用的场景。

所以这一年的工作主要是开发传统模式的数据仓库的开发,如何聚合CUBE、如何设计实现ETL的工具,为下一年进入分布式计算打下基础。

posted on 2016-01-26 07:18  gstsyyb  阅读(127)  评论(0编辑  收藏  举报