摘要: 一.Hdfs简介 hdfs是一个文件系统,用于存储文件,通过统一的命名空间——目录树来定位文件,并且是分布式的,由很多服务器联合起来实现其功能,集群中的服务器各自负责角色; 重要特征: 1.HDFS中的文件在物理上是分块存储(block),块的大小可以通过配置参数( dfs.blocksize)来规 阅读全文
posted @ 2017-02-14 09:59 渐行渐远的记忆 阅读(15367) 评论(0) 推荐(0) 编辑
摘要: 一.准备Linux环境(虚拟机) 1.先将虚拟机的网络模式选为NAT 2.修改主机名 vi /etc/sysconfig/network NETWORKING=yes HOSTNAME=hdp-node-01 3.修改IP vim /etc/sysconfig/network-scripts/ifc 阅读全文
posted @ 2017-02-13 17:47 渐行渐远的记忆 阅读(254) 评论(0) 推荐(0) 编辑
摘要: 一.hadoop介绍 二.hadoop产生背景 1.HADOOP最早起源于Nutch。Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题——如何解决数十亿网页的存储和索引问题。 2.2003年、2004年谷歌发表的两篇 阅读全文
posted @ 2017-02-13 17:27 渐行渐远的记忆 阅读(217) 评论(0) 推荐(0) 编辑