摘要: 目标 v 理解网站点击流数据分析的业务背景 v 理解网站点击流数据分析中常用分析指标的业务含义 v 掌握网站点击流数据分析系统的技术架构 v 掌握网站点击流数据分析系统中各环节的技术实现 v 能独立设计完成一个初步的网站点击流数据分析系统 网站点击流数据分析,业务知识,推荐书籍: 《网站分析实战—— 阅读全文
posted @ 2019-04-11 16:46 烽火连城516 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 辅助系统 离线辅助系统 数据接入 Flume介绍 Flume组件 Flume实战案例 任务调度 调度器基础 市面上调度工具 Oozie的使用 Oozie的流程定义详解 数据导出 sqoop基础知识 sqoop实战及原理 Sqoop数据导入实战 Sqoop数据导出实战 Sqoop作业操作 Sqoop的 阅读全文
posted @ 2019-04-11 16:10 烽火连城516 阅读(710) 评论(0) 推荐(0) 编辑
摘要: HADOOP高可用机制 HA运作机制 什么是HA HADOOP如何实现HA HDFS-HA详解 HA集群搭建 目标: 掌握分布式系统中HA机制的思想 掌握HADOOP内置HA的运作机制 掌握HADOOP2.x的HA集群机制配置 1 Hadoop的HA机制 前言:正式引入HA机制是从hadoop2.0 阅读全文
posted @ 2019-04-11 15:57 烽火连城516 阅读(592) 评论(0) 推荐(0) 编辑
摘要: HDFS详解大纲 Hadoop HDFS 分布式文件系统DFS简介 HDFS的系统组成介绍 HDFS的组成部分详解 副本存放策略及路由规则 命令行接口 Java接口 客户端与HDFS的数据流讲解 目标: 掌握hdfs的shell操作 掌握hdfs的java api操作 理解hdfs的工作原理 *** 阅读全文
posted @ 2019-04-11 15:49 烽火连城516 阅读(343) 评论(0) 推荐(0) 编辑
摘要: 1. hbase简介 1.1. 什么是hbase HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBASE技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBASE的目标是存储并处理大型的数据,更具体来说是仅需使用普通的硬件配置,就能够处理由成千上万的行和列所组 阅读全文
posted @ 2019-04-11 15:30 烽火连城516 阅读(1747) 评论(0) 推荐(0) 编辑