Hadoop博客笔记本

hadoop

  海量数据

    大数据量,海量数据 处理方法总结

    布隆过滤器应用

    悉数那些“巨型”数据仓库

    Hadoop在业界的使用情况

    淘宝Hadoop集群的概况

  分布式

    Paxos在大型系统中常见的应用场景

  hadoop的实现

    

    基于hadoop的crc校验谈hadoop的离线设计思想

    

  基础

    Hadoop使用场景

    mapreduce作业流程概论

    How MapReduce Works

    HDFS 读写流程

    Hadoop在MapReduce中使用压缩详解

    HDFS数据的Checksum

    Hadoop开发常用的InputFormat和OutputFormat

    Hadoop之failed task和killed task

    Hadoop的调度器总结

    Hadoop计算能力调度器算法解析

    Hadoop计算能力调度器应用和配置

  管理

    hadoop集群部署

    hadoop部署注意项

    hadoop配置文件说明

    hadoop集群默认配置和常用配置

    Hadoop FS Shell

    Hadoop Shell 讲解

    Hadoop回收站trash

    Hadoop添加节点datanode

    Hadoop删除节点

    HDFS 安全模式

    hadoop SecondaryNameNode和NameNode

    hadoop 根据SecondaryNameNode恢复Namenode

    hadoop的dfs.replication

    hadoop升级

  问题和方法

  调优

hive

  基础

    hive常用操作

    hive函数手册

  管理

    hive部署手册

  应用

    Hadoop和Hive的数据处理流程

    hive并发调用的运行方式-个人经验篇

    hive的大数据倾斜

    hive的join优化

    hive的not in

hbase

  基础

  管理

    Hbase配置手册

pig

  基础

  管理

    pig部署手册

 

posted @ 2012-11-21 11:34  蜗牛123  阅读(184)  评论(0编辑  收藏  举报