05 2019 档案
摘要:Hbase安装 安装 官网下载tar包(二进制的,bin.tar.gz)——解压至/usr/local/下,(改个名,可选)——配置环境变量——加载配置 注意点: 如果采用分布式安装,依赖于Hadoop和zookeeper。先准备好这两个集群。 hbase和hadoop之间存在版本依赖关系。下载时需
阅读全文
摘要:zookper完全分布式安装 zookeeper是一个分布式应用程序协调系统,主要会提供配置服务,分布式服务,权限服务,锁定功能以及分布式数据同步。 http://www eu.apache.org/dist/zookeeper/stable/zookeeper 3.4.12.tar.gz 二、解压
阅读全文
摘要:初识ETL 概念 ETL即Extract Transform Load。目的是将分散、凌乱、异质的数据整合在一起,为决策提供分析数据,是BI项目(Business Intellifence)项目中重要的一个环节,占据1/3左右时间。难点在于清洗转换数据,最终一般存入DW(Data Warehousi
阅读全文
摘要:Java多线程概览 java的多线程是个比较高级的主题。正在学习python的多线程,同步复习以下java多线程的基础知识吧。 介绍一些概念,细节另外再慢慢探究吧。 Java多线程机制 Java语言内置对多线程的支持,在大数据、分布式、高并发类的主题上应用广泛。JVM控制线程的切换。 “进程是资源分
阅读全文
摘要:昨天听的一场报告,感觉不错,整理一下。 (电脑死机,本来都快整理好了,哭) 1.什么是精细化营销 精细化营销就是恰当地、贴切根据客户的差异将客户分群,采取不同的营销策略。比较有名的有天猫的千人千面,亚马逊的图书推荐系统……推荐《大数据时代》,挺不错的科普书。 2.什么是客户分群 客户分群的解读三个角
阅读全文
摘要:python多线程、多进程 初探 原先刚学Java的时候,多线程也学了几天,后来一直没用到。然后接触python的多线程的时候,貌似看到一句”python多线程很鸡肋“,于是乎直接跳过了多线程的学习。 接触爬虫,才开始用到多进程这个东西。 既然用到了,就系统地学吧。先来python的,再总结一下Ja
阅读全文
摘要:大数据概述 物联网、云计算和大数据,是第三次信息化浪潮的产物。 技术支撑:存储设备容量的不断增加、CPU处理能力大幅提升、网络带宽不断增加。 数据产生方式:经历了运营式系统、用户原创阶段,进入了感知式系统阶段,物联网技术,可穿戴设备、各种传感器之类的使数据量更大、更密集。 大数据的4V说法 1. 数
阅读全文

浙公网安备 33010602011771号