摘要: 1、大数据流程图 2、大数据各个环节主要技术 2.1、数据处理主要技术 Sqoop:(发音:skup)作为一款开源的离线数据传输工具,主要用于Hadoop(Hive) 与传统数据库(MySql,PostgreSQL)间的数据传递。它可以将一个关系数据库中数据导入Hadoop的HDFS中, 也可以将H 阅读全文
posted @ 2019-07-01 21:36 seer1 阅读(412) 评论(0) 推荐(0) 编辑
摘要: MapReduce 编程模型 总的来讲,Google MapReduce 所执行的分布式计算会以一组键值对作为输入,输出另一组键值对,用户则通过编写 Map 函数和 Reduce 函数来指定所要进行的计算。 由用户编写的Map 函数将被应用在每一个输入键值对上,并输出若干键值对作为中间结果。之后,M 阅读全文
posted @ 2019-07-01 21:30 seer1 阅读(748) 评论(0) 推荐(0) 编辑