摘要:
一· 1.hive只需要安装在 hadoop主节点上tar -zxvf hive-1.1.0-cdh5.5.2.tar.gz2.[root@h91 ~]# vi /etc/profile或者 .bash_profile添加export HIVE_HOME=/home/hadoop/hive-1.1. 阅读全文
摘要:
基础有限制的数据算平均数 阅读全文
摘要:
实现简单计数过程 阅读全文
摘要:
mapreduce过程,1按block大小分片,分map,k1 v1分片地址,map端k2,v2实现分片数据计数,reduce端k3,v3计算统计词频 阅读全文
摘要:
一、基本概念介绍Kafka是一个分布式的、可分区的、可复制的消息系统。它提供了普通消息系统的功能,但具有自己独特的设计。这个独特的设计是什么样的呢?首先让我们看几个基本的消息系统术语:Kafka将消息以topic为单位进行归纳。将向Kafka topic发布消息的程序成为producers.将预订t 阅读全文