摘要:
R语言作为BI中ETL的工具,增删改 R语言提供了强大的R_package与各种数据库进行数据交互。 外加其强大数据变换清洗函数,为ETL提供一条方便快捷的道路。 RODBC ROracal RMysql Rmongodb http://mirrors.ustc.edu.cn/CRAN/web/pa 阅读全文
摘要:
Yarn 原理介绍 大纲: Hadoop 架构介绍 YARN 产生的背景 YARN 基础架构及原理 Hadoop的1.X架构的介绍 在1.x中的NameNodes只可能有一个,虽然可以通过SecondaryNameNode与NameNode进行数据同步备份,但是总会存在一定的时延,如果NameNod 阅读全文
摘要:
大数据实战(上) # MapReduce原理介绍 大纲: * Mapreduce介绍 * MapReduce2运行原理 * shuffle及排序 定义 * Mapreduce 最早是由google公司研究提出的一种免息nag大规模数据处理的并行计算模型和方法。是hadoop面向大数据并行处理的计算模 阅读全文