2016 年 4月 18 日随笔档案 - 哼哼哈哈二将

2016年4月18日

摘要： Java Web 高性能开发，第 2 部分: 前端的高性能 Java Web 高性能开发，第 2 部分: 前端的高性能 Web 发展的速度让许多人叹为观止，层出不穷的组件、技术，只需要合理的组合、恰当的设置，就可以让 Web 程序性能不断飞跃。Web 的思想是通用的，它们也可以运用到 Java We 阅读全文

posted @ 2016-04-18 16:59 哼哼哈哈二将阅读(535) 评论(0) 推荐(0) 编辑

HDFS的工作原理扫扫盲

摘要：问题导读： 1.什么是分布式文件系统？ 2.怎样分离元数据和数据？ 3.HDFS的原理是什么？ Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统。HDFS是一个高度容错性的系统，适合部署在廉价的机器上。它能提供高吞吐量的数据访问，非常适合大规模数据集上的应用阅读全文

posted @ 2016-04-18 11:50 哼哼哈哈二将阅读(423) 评论(0) 推荐(0) 编辑

Mapreduce shuffle和排序

摘要： Mapreduce为了确保每个reducer的输入都按键排序。系统执行排序的过程将map的输出作为输入传给reducer 称为shuffle。学习shuffle是如何工作的有助于我们理解mapreduce工作机制。shuffle属于hadoop不断被优化和改进的代码库的一部分。从许多方面看，shu 阅读全文

posted @ 2016-04-18 11:16 哼哼哈哈二将阅读(819) 评论(0) 推荐(0) 编辑

map/reduce类简单介绍

摘要：在Hadoop的mapper类中，有4个主要的函数，分别是：setup，clearup，map，run。代码如下： protected void setup(Context context) throws IOException, InterruptedException { // NOTHING 阅读全文

posted @ 2016-04-18 11:03 哼哼哈哈二将阅读(413) 评论(0) 推荐(0) 编辑

生动有趣地讲解Map/Reduce基本原理

摘要： Hadoop简介Hadoop就是一个实现了Google云计算系统的开源系统，包括并行计算模型Map/Reduce，分布式文件系统HDFS，以及分布式数据库Hbase，同时Hadoop的相关项目也很丰富，包括ZooKeeper，Pig，Chukwa，Hive，Hbase，Mahout，flume等.这阅读全文

posted @ 2016-04-18 10:54 哼哼哈哈二将阅读(389) 评论(0) 推荐(0) 编辑

hadoop使用场景

摘要：大数据量存储：分布式存储日志处理: Hadoop擅长这个海量计算: 并行计算 ETL:数据抽取到oracle、mysql、DB2、mongdb及主流数据库使用HBase做数据分析: 用扩展性应对大量的写操作—Facebook构建了基于HBase的实时数据分析系统机器学习: 比如Apache 阅读全文

posted @ 2016-04-18 10:31 哼哼哈哈二将阅读(3390) 评论(0) 推荐(0) 编辑

哼哼哈哈二将

公告