摘要:
Hbase安装 安装 官网下载tar包(二进制的,bin.tar.gz)——解压至/usr/local/下,(改个名,可选)——配置环境变量——加载配置 注意点: 如果采用分布式安装,依赖于Hadoop和zookeeper。先准备好这两个集群。 hbase和hadoop之间存在版本依赖关系。下载时需 阅读全文
摘要:
zookper完全分布式安装 zookeeper是一个分布式应用程序协调系统,主要会提供配置服务,分布式服务,权限服务,锁定功能以及分布式数据同步。 http://www eu.apache.org/dist/zookeeper/stable/zookeeper 3.4.12.tar.gz 二、解压 阅读全文
摘要:
初识ETL 概念 ETL即Extract Transform Load。目的是将分散、凌乱、异质的数据整合在一起,为决策提供分析数据,是BI项目(Business Intellifence)项目中重要的一个环节,占据1/3左右时间。难点在于清洗转换数据,最终一般存入DW(Data Warehousi 阅读全文
摘要:
Java多线程概览 java的多线程是个比较高级的主题。正在学习python的多线程,同步复习以下java多线程的基础知识吧。 介绍一些概念,细节另外再慢慢探究吧。 Java多线程机制 Java语言内置对多线程的支持,在大数据、分布式、高并发类的主题上应用广泛。JVM控制线程的切换。 “进程是资源分 阅读全文