摘要:kylin 系列(一)安装部署 一、环境说明 1.1 版本选择 cdh 版本下载地址: 软件名称 | 版本 | JDK | 1.8 HADOOP | Hadoop2.6.0 cdh5.10 ZOOKEERER | 3.4.5 HBASE | Hbase1.2.0 cdh5.10 HIVE | Hiv
阅读全文
摘要:CDH 安装 市场上免费大数据框架主要有三个版本,原生的 Apache 版本,Cloudera() 公司研发的(Cloudera Distribution Hadoop,简称“CDH”)CDH 版本,也是市场上使用最多的,Hortonworks 版本(Hortonworks Data Platfor
阅读全文
摘要:Hadoop 系列(三)Java API 一、HDFS 操作 1. Configuration 配置文件默认读取 resources 目录下的 core site.xml、hdfs site.xml、mapred site.xml、yarn site.xml 文件。可以将 Hadoop 安装目录下的
阅读全文
摘要:Hive 系列(二)权限管理 一、关于 Hive Beeline 问题 启动 hiveserver2 服务,启动 beeline u jdbc:hive2:// 正常 ,启动 beeline u jdbc:hive2://127.0.0.1:10000 报如下错误 Error: Failed to
阅读全文
摘要:Hive 系列(一)安装部署 Hive 官网:。 "参考手册" 一、环境准备 1. __JDK 1.8__ :从 Oracle 官网下载,设置环境变量(JAVA_HOME、PATH 和 CLASSPATH)。 2. __Hadoop 2.9.2__ :基础平台。 3. __Hive 2.3.4__
阅读全文
摘要:01 Flume系列(一)安装配置 Flume() is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log d
阅读全文
摘要:Hadoop 系列(二)安装配置 Hadoop 官网: 一、Hadoop 安装 1.1 Hadoop 依赖的组件 1. __JDK__ :从 Oracle 官网下载,设置环境变量(JAVA_HOME、PATH 和 CLASSPATH)。 2. __SSH(安全外壳标议)__ :推荐安装 Openss
阅读全文
摘要:Hadoop 系列(一)基本概念 一、Hadoop 简介 Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构,它可以使用户在不了解分布式底层细节的情況下开发分布式程序,充分利用集群的威力进行高速运算和存储。 从其定义就可以发现,它解決了两大问题:大数据存储、大数据分析。也就是 H
阅读全文