分布式处理大数据的目录及学习树

    针对大数据的特点,传统集中式处理已不能满足大数据的处理要求。因此,利用分布式处理对大数据的收集、ETL、计算、使用是必由之路。

    本博不是什么技术大拿,只是记录在学习利用分布式处理大数据过程中的心得和踩过的坑,自娱自乐,也顺便众乐乐,欢迎大家批评指正相互撕逼,注意文明就好。

    下图是一个学习过程中可能涉及的必要技术。如果没有这些前置技术的基础,可能影响后续使用的效率。当然,每个分支都是庞大复杂,因此只截取部分用得上的技术,尽快在分布式大数据处理过程中出结果,尽早自high。毕竟现在的社会追求效率。

    未来也会根据学习树的顺序逐步充实blog内容,因此学习树也可以看做一个索引。学习树也会根据情况进行修改。

    书名号《》是看过的书目,按顺序排在前面的也是推荐的。个人理解不一样,因此我觉得好但不一定最好。总之,他好我也好,早吃肾宝。

    知识的年代,欢迎自取、转载和使用,但请标明出处,相互尊重和理解,不要伤害。

posted @ 2017-04-11 11:27  alpha118  阅读(761)  评论(0编辑  收藏  举报