1 2 Fork me on GitHub 6

06 2021 档案

摘要:一、Mapreduce 原理 一个reduce任务的MapReduce数据流 多个reduce任务的MapReduce数据流 combiner调优 集群上的可用带宽限制了MapReduce作业的数量,因此尽量避免map和reduce任务之间的数据传输是有利的,Hadoop允许用户正对map任务的输出 阅读全文
posted @ 2021-06-26 20:31 peng_li 阅读(185) 评论(0) 推荐(0)
摘要:一、数据模型概念 数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度来合理存储数据。简单来说,数据建模就是搞清楚每个表都有哪些字段、表之间有什么联系,然后根据需要添加字段或度量值、建立关系的过程。 目的:更好的组织和存储数据,以便在性能、成本、效率、质量之间取得平衡。 二、从OLTP和 阅读全文
posted @ 2021-06-18 09:14 peng_li 阅读(946) 评论(0) 推荐(0)
摘要:1.MapReduce 工作原理:https://blog.csdn.net/m0_37558366/article/details/89500539 2.MapReduce、Hive、Spark中数据倾斜:https://blog.csdn.net/lzw2016/article/details/ 阅读全文
posted @ 2021-06-18 09:12 peng_li 阅读(529) 评论(0) 推荐(0)

1