2015 年 7月 2 日随笔档案 - lvyafei

2015年7月2日

摘要： http://tech.uc.cn/?p=2159诞生在2011年Storm开源之前，由于Hadoop的火红，整个业界都在喋喋不休地谈论大数据。Hadoop的高吞吐，海量数据处理的能力使得人们可以方便地处理海量数据。但是，Hadoop的缺点也和它的优点同样鲜明——延迟大，响应缓慢，运维复杂。　... 阅读全文

posted @ 2015-07-02 16:40 lvyafei 阅读(203) 评论(0) 推荐(0) 编辑

Spark：一个高效的分布式计算系统

摘要： http://tech.uc.cn/?p=2116概述什么是SparkSpark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行计算框架，Spark基于map reduce算法实现的分布式计算，拥有Hadoop MapReduce所具有的优点；但不同于M... 阅读全文

posted @ 2015-07-02 16:35 lvyafei 阅读(326) 评论(0) 推荐(0) 编辑

流式大数据处理的三种框架：Storm，Spark和Samza

摘要：许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍，然后尝试快速、高度概述其异同。Apache Storm在Storm中，先要设计一个用于实时计算的图状结构，我们称之为拓扑（topology）。这个拓扑将会被提交给集群，由集群中的主控节点（master... 阅读全文

posted @ 2015-07-02 14:21 lvyafei 阅读(194) 评论(0) 推荐(0) 编辑

Docker在github上的站点

摘要： https://github.com/docker (docker在github上的官方地址)https://github.com/dockerfile (docker官方镜像的Dockerfile地址地址一)https://github.com/docker-library (docker官方镜... 阅读全文

posted @ 2015-07-02 11:28 lvyafei 阅读(605) 评论(0) 推荐(0) 编辑

大型网站架构体系的演变

摘要：出处:http://blog.csdn.net/dinglang_2009/article/details/46398885互联网上有很多关于网站架构的各种分享，有些主要是从运维和基础架构的角度去分析的（堆机器，做集群），太关注技术细节实现，普通的开发人员基本看不太懂。本文上篇将主要介绍大型网站基础... 阅读全文

posted @ 2015-07-02 10:29 lvyafei 阅读(236) 评论(0) 推荐(0) 编辑

lvyafei

公告