零点社区 - 博客园

2019年1月15日

摘要： HDFS上传脚本实例： HDFS下载实例：阅读全文

posted @ 2019-01-15 20:44 零点社区阅读(720) 评论(0) 推荐(0)

2019年1月6日

摘要：一、HDFS的新特性HA (一)HDFS的HA机制 Hadoop 2.2.0 版本之前，NameNode是HDFS集群的单点故障点，每一个集群只有一个NameNode ，如果这个机器或者进程不可用，整个集群就无法使用，直到重启NameNode或者新重启一个NameNode节点。影响HDFS集群不阅读全文

posted @ 2019-01-06 19:40 零点社区阅读(599) 评论(0) 推荐(0)

HDFS2.X架构及工作原理

摘要： 1 HDFS简介 1.1 Hadoop 2.0介绍 Hadoop是Apache的一个分布式系统基础架构，可以为海量数据提供存储和计算。Hadoop 2.0即第二代Hadoop系统，其框架最核心的设计是HDFS、MapReduce和YARN。其中，HDFS为海量数据提供存储，MapReduce用于分布阅读全文

posted @ 2019-01-06 19:31 零点社区阅读(1121) 评论(0) 推荐(1)

2019年1月3日

浅析Secondary NameNode与namenode

摘要：前言最近刚接触Hadoop, 一直没有弄明白NameNode和Secondary NameNode的区别和关系。很多人都认为，Secondary NameNode是NameNode的备份，是为了防止NameNode的单点失败的，直到读了这篇文章Secondary Namenode - What i 阅读全文

posted @ 2019-01-03 12:31 零点社区阅读(650) 评论(0) 推荐(0)

2018年12月30日

Flink安装部署

摘要： Flink概述 Apache Flink是一个框架和分布式处理引擎，用于对无界和有界数据流进行有状态计算。Flink设计为在所有常见的集群环境中运行，以内存速度和任何规模执行计算。 Flink特点 1)随处部署应用与其它组件集成！flink是分布式系统，需要计算资源才可执行程序。flink可以与常见阅读全文

posted @ 2018-12-30 19:45 零点社区阅读(1621) 评论(0) 推荐(0)

2018年12月29日

HDFS基本命令行操作与简单API实用

摘要： 1.hdfs的客户端 1）.网页形式->测试用 http://192.168.37.129:50070/dfshealth.html#tab-overview 2）.命令行形式->测试用 3）.企业级API 2.命令行形式 1）查看帮助 hdfs dfs -help 2）查看当前目录信息 hdfs 阅读全文

posted @ 2018-12-29 17:41 零点社区阅读(357) 评论(0) 推荐(0)

Linux基础_Hadoop环境搭建必备

摘要： 1.Linux的目录结构 bin:存放二进制的可执行文件 sbin:存放二进制的可执行文件，只有root才能访问 etc:存放系统配置文件 usr:用于存放共享的系统资源（约定俗称） home:存放用户文件的根目录 root:超级用户的目录 dev:用于存放设备文件 lib:存放根本文件系统中的程序阅读全文

posted @ 2018-12-29 16:45 零点社区阅读(155) 评论(0) 推荐(0)

2018年12月28日

HBase BlockCache机制讲解

摘要： HBase上RegionServer的cache主要分为两个部分，分别是memstore&blockcache，其中memstore主要用于写缓存，而blockcache用于读缓存。当数据写入hbase时，会先写入memstore，RegionServer会给每个region提供一个memstor 阅读全文

posted @ 2018-12-28 20:57 零点社区阅读(1742) 评论(0) 推荐(0)

HDFS集群安装部署

摘要： 1-> 集群的准备工作 1）关闭防火墙(进行远程连接) firewall-cmd --state -- 显示centOS7防火墙状态 systemctl stop firewalld -- 关闭防火墙 systemctl disable firewalld -- 禁止开机自启动 2）永久修改设置主机阅读全文

posted @ 2018-12-28 20:53 零点社区阅读(221) 评论(0) 推荐(0)

数据探索实践

公告