摘要: Hbase安装 安装 官网下载tar包(二进制的,bin.tar.gz)——解压至/usr/local/下,(改个名,可选)——配置环境变量——加载配置 注意点: 如果采用分布式安装,依赖于Hadoop和zookeeper。先准备好这两个集群。 hbase和hadoop之间存在版本依赖关系。下载时需 阅读全文
posted @ 2019-05-29 16:20 落音 阅读(372) 评论(0) 推荐(0) 编辑
摘要: zookper完全分布式安装 zookeeper是一个分布式应用程序协调系统,主要会提供配置服务,分布式服务,权限服务,锁定功能以及分布式数据同步。 http://www eu.apache.org/dist/zookeeper/stable/zookeeper 3.4.12.tar.gz 二、解压 阅读全文
posted @ 2019-05-29 16:17 落音 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 初识ETL 概念 ETL即Extract Transform Load。目的是将分散、凌乱、异质的数据整合在一起,为决策提供分析数据,是BI项目(Business Intellifence)项目中重要的一个环节,占据1/3左右时间。难点在于清洗转换数据,最终一般存入DW(Data Warehousi 阅读全文
posted @ 2019-05-29 02:25 落音 阅读(246) 评论(0) 推荐(0) 编辑
摘要: Java多线程概览 java的多线程是个比较高级的主题。正在学习python的多线程,同步复习以下java多线程的基础知识吧。 介绍一些概念,细节另外再慢慢探究吧。 Java多线程机制 Java语言内置对多线程的支持,在大数据、分布式、高并发类的主题上应用广泛。JVM控制线程的切换。 “进程是资源分 阅读全文
posted @ 2019-05-29 02:13 落音 阅读(405) 评论(0) 推荐(0) 编辑