Hadoop博客笔记本

　　海量数据

　　　　大数据量，海量数据处理方法总结

　　　　布隆过滤器应用

　　　　悉数那些“巨型”数据仓库

　　　　Hadoop在业界的使用情况

　　　　淘宝Hadoop集群的概况

　　分布式

　　　　Paxos在大型系统中常见的应用场景

　　hadoop的实现

　　　　序

　　　　基于hadoop的crc校验谈hadoop的离线设计思想

　　　　

　　基础

　　　　Hadoop使用场景

　　　　mapreduce作业流程概论

　　　　How MapReduce Works

　　　　HDFS 读写流程

　　　　Hadoop在MapReduce中使用压缩详解

　　　　HDFS数据的Checksum

　　　　Hadoop开发常用的InputFormat和OutputFormat

　　　　Hadoop之failed task和killed task

　　　　Hadoop的调度器总结

　　　　Hadoop计算能力调度器算法解析

　　　　Hadoop计算能力调度器应用和配置

　　管理

　　　　hadoop集群部署

　　　　hadoop部署注意项

　　　　hadoop配置文件说明

　　　　hadoop集群默认配置和常用配置

　　　　Hadoop FS Shell

　　　　Hadoop Shell 讲解

　　　　Hadoop回收站trash

　　　　Hadoop添加节点datanode

　　　　Hadoop删除节点

　　　　HDFS 安全模式

　　　　hadoop SecondaryNameNode和NameNode

　　　　hadoop 根据SecondaryNameNode恢复Namenode

　　　　hadoop的dfs.replication

　　　　hadoop升级

　　问题和方法

　　调优

hive

　　基础

　　　　hive常用操作

　　　　hive函数手册

　　管理

　　　　hive部署手册

　　应用

　　　　Hadoop和Hive的数据处理流程

　　　　hive并发调用的运行方式-个人经验篇

　　　　hive的大数据倾斜

　　　　hive的join优化

　　　　hive的not in

hbase

　　基础

　　管理

　　　　Hbase配置手册

pig

　　基础

　　管理

　　　　pig部署手册

posted @ 2012-11-21 11:34 蜗牛123 阅读(184) 评论(0) 编辑收藏举报

刷新页面返回顶部