摘要: Hadoop 单机模式安装配置 • Hadoop 的单机模式安装非常简单,只需要配置好环境变量即可运行,这个模式一般用来学习和测试hadoop 的功能。 1、获取软件 http://hadoop.apache.org/ 2、安装配置 java 环境,安装 jps 工具 3、设置环境变量,启动运行 v 阅读全文
posted @ 2018-09-05 21:50 zzclog 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 大数据是做什么的 • 大数据– 随着计算机技术的发展,互联网的普及,信息的积累已经到了一个非常庞大的地步,信息的增长也在不断 的加快,随着互联网、物联网建设的加快,信息更是爆炸是增长,收集、检索、统计这些信息越发困难, 必须使用新的技术来解决这些问题 • 大数据的定义:1、 大数据由巨型数据集组成, 阅读全文
posted @ 2018-09-05 15:14 zzclog 阅读(377) 评论(0) 推荐(0) 编辑
摘要: NameNode 高可用 •为什么 NameNode 需要高可用 – NameNode 是 HDFS 的核心配置,HDFS 又是 Hadoop 的核心组件,NameNode 在 Hadoop 集群中至关重要,NameNode机器宕机,将导致集群不可用,如果NameNode 数据丢失将导致整个集群的数 阅读全文
posted @ 2018-09-05 14:28 zzclog 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 搭建kafka 首先要搭建好 前面的 zookeeper 环境 • kafka是什么? – Kafka是由LinkedIn开发的一个分布式的消息系统 – kafka是使用Scala编写 – kafka是一种消息中间件 • 为什么要使用 kafka – 解耦、冗余、提高扩展性、缓冲 – 保证顺序,灵活 阅读全文
posted @ 2018-09-05 11:58 zzclog 阅读(773) 评论(0) 推荐(0) 编辑
摘要: zookeeper • zookeeper 是什么? – ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务 • ZooKeeper能干什么哪? – ZooKeeper是用来保证数据在集群间的事务性一致 zookeeper • zookeeper 是什么? – ZooKeeper是一 阅读全文
posted @ 2018-09-05 11:55 zzclog 阅读(118) 评论(0) 推荐(0) 编辑