山上有风景

2020年3月7日

摘要：一：推文 Kafka学习之路（一）Kafka的简介 Kafka学习之路（二）Kafka的架构 Kafka学习之路（三）Kafka的高可用 Kafka学习之路（四）Kafka的安装 Kafka学习之路（五）Kafka在zookeeper中的存储二：Kafka架构原理（一）Kafka应用场阅读全文

posted @ 2020-03-07 15:35 山上有风景阅读(598) 评论(0) 推荐(0) 编辑

2020年3月6日

Storm安装及使用

摘要：一：安装storm （一）安装一个zookeeper集群注意：需要先启动zookeeper集群才可以，不然后面容易出错（二）上传storm的安装包，解压（三）修改配置文件storm.yaml #所使用的zookeeper集群主机 storm.zookeeper.servers: - "hado 阅读全文

posted @ 2020-03-06 18:57 山上有风景阅读(1081) 评论(0) 推荐(0) 编辑

2020年3月3日

Storm简介

摘要：补充：实时流计算和离线数据流计算（一）离线计算离线计算：批量获取数据、批量传输数据、周期性批量计算数据、数据展示代表技术：Sqoop批量导入数据、HDFS批量存储数据、MapReduce批量计算数据、Hive批量计算数据、***任务调度 1，hivesql 2、调度平台 3、Hadoop集群运维阅读全文

posted @ 2020-03-03 22:51 山上有风景阅读(1005) 评论(0) 推荐(0) 编辑

hive、Hbase、mysql的区别

摘要：补充：Hadoop生态圈一：Hive和HBase的区别 1）hive是sql语言，通过数据库的方式来操作hdfs文件系统，为了简化编程，底层计算方式为mapreduce。 2）hive是面向行存储的数据库。 3）Hive本身不存储和计算数据，它完全依赖于HDFS和MapReduce，Hive中的表阅读全文

posted @ 2020-03-03 20:28 山上有风景阅读(406) 评论(0) 推荐(0) 编辑

HBaseclientAPI基本操作

摘要：一：Java类于HBase数据模型二：HBaseConfiguration 包名： org.apache.hadoop.hbase.HBaseConfiguration作用：对HBase进行配置。使用方法演示样例： HBaseConfiguration hconfig = new HBaseCo 阅读全文

posted @ 2020-03-03 20:10 山上有风景阅读(1338) 评论(0) 推荐(0) 编辑

HBase(基于HDFS)的使用

摘要：补充：使用secure CRT操作hbase （一）修改secureCRT配置环境（二）使用hbase，查看所有命令一：create建表（创建user表，包括base_info、extra_info两个列族） create 'user',{NAME=>'base_info',VERSIONS=> 阅读全文

posted @ 2020-03-03 16:57 山上有风景阅读(627) 评论(0) 推荐(0) 编辑

HBase(基于HDFS)的介绍及安装

摘要：一：HBase简介（一）HBase了解（实现对大<普通PC集群、十亿行，百万列>数据随机、实时存取操作）前提：基于Hdfs的查询由于其存储机制的限制，导致查询速度响应缓慢，无法解决一些对速度有要求的场景；传统数据库虽然查询快，但是无法支撑海量数据。因此就出现了HBase这种"数据库"。 HBa 阅读全文

posted @ 2020-03-03 14:46 山上有风景阅读(1305) 评论(0) 推荐(0) 编辑

2020年3月2日

hive(基于mapreduce)的使用

摘要：一：数据表建立（一）创建数据库 hive> create database hadoop; hive> use hadoop; 数据库位置在 hdfs://ns1/user/hive/warehouse/hadoop.db目录下（二）建表 hive> create table t_order(i 阅读全文

posted @ 2020-03-02 20:10 山上有风景阅读(2065) 评论(0) 推荐(1) 编辑

hive(基于mapreduce)的介绍及安装

摘要：一：hive简介 Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上，总归为大数据，并使得查询和分析方便。并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。 Hive 构建在基于静态批处理的Hadoop 之上，Hadoop 通常阅读全文

posted @ 2020-03-02 10:31 山上有风景阅读(605) 评论(0) 推荐(0) 编辑

2020年2月28日

分布式集群HA模式部署

摘要：一：HDFS系统架构（一）利用secondary node备份实现数据可靠性（二）问题：NameNode的可用性不高，当NameNode节点宕机，则服务终止二：HA架构提高NameNode服务的可用性架构中至少有两个NameNode节点（此处以两个NameNode举例）（一）两个NN节阅读全文

posted @ 2020-02-28 16:21 山上有风景阅读(2985) 评论(0) 推荐(0) 编辑

周围的人都比你厉害，你才会慢慢变强

公告