摘要:
1.分布式文件系统理解 使用低配置电脑配置成集群,存储管理单台电脑不能处理的大型文件。 直观理解三个臭皮匠,顶个诸葛亮。 很多磁盘加一起就可以装超多电影。 类似于你出5毛,我出5毛,我们一起凑一块。 2.hdfs优缺点 优点: a.高容错性:数据自动保存多个副本;通过增加副本的形式,提高容错性。一个 阅读全文
摘要:
1.Centos 7 关闭防火墙:systemctl stop firewalld 打开防火墙:systemctl start firewalld 查看防火墙开启信息:systemctl status firewalld 关闭开机启动防火墙:systemctl disable ffirewalld 阅读全文
摘要:
1.Hadoop的发展历史起源介绍 a.Hadoop最早起源于Nutch、Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取、索引、查询的功能,但随着抓取网页数量的增加,遇到了严重的可扩展的问题——如何解决数10亿网页的存储和索引问题。 b.2003、2004年谷歌发表的两篇论文为该问题 阅读全文
摘要:
1.排查思路 大数据集群运行在linux系统上总会遇见各种各样的问题,我们要定位问题,基本上可以从这几个方面入手排查:cpu、内存、磁盘io、网络、GC等。 2.cpu 一些概念:多核,超线程,cpu频率(2.2GHZ) (节能模式,普通模式,超能模式:biso里设置,搭建集群要注意下这个参数尽量关 阅读全文