上一页 1 ··· 4 5 6 7 8 9 下一页
摘要: 一· 1.hive只需要安装在 hadoop主节点上tar -zxvf hive-1.1.0-cdh5.5.2.tar.gz2.[root@h91 ~]# vi /etc/profile或者 .bash_profile添加export HIVE_HOME=/home/hadoop/hive-1.1. 阅读全文
posted @ 2018-05-13 23:22 蜘蛛侠0 阅读(133) 评论(0) 推荐(0) 编辑
摘要: ip访问量及其会话量 阅读全文
posted @ 2018-04-22 20:28 蜘蛛侠0 阅读(634) 评论(0) 推荐(0) 编辑
摘要: 基础有限制的数据算平均数 阅读全文
posted @ 2018-03-25 18:56 蜘蛛侠0 阅读(200) 评论(0) 推荐(0) 编辑
摘要: 数据去重基础 阅读全文
posted @ 2018-03-18 22:12 蜘蛛侠0 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 实现简单计数过程 阅读全文
posted @ 2018-03-11 23:19 蜘蛛侠0 阅读(390) 评论(0) 推荐(0) 编辑
摘要: mapreduce过程,1按block大小分片,分map,k1 v1分片地址,map端k2,v2实现分片数据计数,reduce端k3,v3计算统计词频 阅读全文
posted @ 2018-03-10 15:42 蜘蛛侠0 阅读(219) 评论(0) 推荐(0) 编辑
摘要: hdfs脚本基本操作 阅读全文
posted @ 2018-03-04 20:59 蜘蛛侠0 阅读(371) 评论(0) 推荐(0) 编辑
摘要: HandBook_2 阅读全文
posted @ 2018-02-22 17:19 蜘蛛侠0 阅读(262) 评论(0) 推荐(0) 编辑
摘要: HandBook_1 阅读全文
posted @ 2018-02-22 17:06 蜘蛛侠0 阅读(350) 评论(0) 推荐(0) 编辑
摘要: 一、基本概念介绍Kafka是一个分布式的、可分区的、可复制的消息系统。它提供了普通消息系统的功能,但具有自己独特的设计。这个独特的设计是什么样的呢?首先让我们看几个基本的消息系统术语:Kafka将消息以topic为单位进行归纳。将向Kafka topic发布消息的程序成为producers.将预订t 阅读全文
posted @ 2018-02-08 11:30 蜘蛛侠0 阅读(203) 评论(0) 推荐(0) 编辑
上一页 1 ··· 4 5 6 7 8 9 下一页