摘要: 摘要:随着数据体积的越来越大,实时处理成为了许多机构需要面对的首要挑战。Shruthi Kumar和Siddharth Patankar在Dr.Dobb’s上结合了汽车超速监视,为我们演示了使用Storm进行实时大数据分析。CSDN在此编译、整理。简单和明了,Storm让大数据分析变得轻松加愉快。当... 阅读全文
posted @ 2015-05-05 22:23 苦逼码农2014 阅读(258) 评论(0) 推荐(0) 编辑
摘要: 介绍Kafka是一个分布式的、可分区的、可复制的消息系统。它提供了普通消息系统的功能,但具有自己独特的设计。这个独特的设计是什么样的呢?首先让我们看几个基本的消息系统术语:Kafka将消息以topic为单位进行归纳。将向Kafka topic发布消息的程序成为producers.将预订topics并... 阅读全文
posted @ 2015-05-05 14:26 苦逼码农2014 阅读(464) 评论(0) 推荐(0) 编辑
摘要: 引子云计算越来越流行的今天,单一机器处理能力已经不能满足我们的需求,不得不采用大量的服务集群。服务集群对外提供服务的过程中,有很多的配置需要随时更新,服务间需要协调工作,这些信息如何推送到各个节点?并且保证信息的一致性和可靠性?众所周知,分布式协调服务很难正确无误的实现,它们很容易在竞争条件和死锁上... 阅读全文
posted @ 2015-05-04 23:42 苦逼码农2014 阅读(120) 评论(0) 推荐(0) 编辑
摘要: Kafka 分布式消息队列 类似产品有JBoss、MQ一、由Linkedln 开源,使用scala开发,有如下几个特点:(1)高吞吐(2)分布式(3)支持多语言客户端 (C++、Java)二、组成:客户端是 producer 和 consumer,提供一些API,服务器端是Broker,客户端提供可... 阅读全文
posted @ 2015-05-04 22:13 苦逼码农2014 阅读(473) 评论(0) 推荐(0) 编辑
摘要: kafka采用了一些非主流(unconventional)并经过实践的设计使其高效和可扩展。在实际使用中kafka显示出了相对于常见流行的消息系统的优越性。并且每天能够处理上百GB的新的数据。类似收集实时数据来获得查询、推荐、广告方感兴趣的内容时,需要计算大量细粒度的点击率,还包括那些没有点击的页面... 阅读全文
posted @ 2015-05-01 23:31 苦逼码农2014 阅读(649) 评论(0) 推荐(0) 编辑
摘要: Flume-ngFlume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 Flume的文档可以看http://flume.apache.org/FlumeUserGuide.html官方的英文文档 介绍的比较全面。 不过这里写写自己的见解这个是flume的架构图从上图可以看到几个名词... 阅读全文
posted @ 2015-05-01 23:13 苦逼码农2014 阅读(431) 评论(0) 推荐(0) 编辑
摘要: 技术实现本系列由两篇文章组成,介绍了当前用于 Linux 操作系统上的几种零拷贝技术,简单描述了各种零拷贝技术的实现,以及它们的特点和适用场景。第一部分主要介绍了一些零拷贝技术的相关背景知识,简要概述了 Linux 为什么需要零拷贝技术以及 Linux 中都有哪几种零拷贝技术。本文是本系列文章的第二... 阅读全文
posted @ 2015-04-30 23:44 苦逼码农2014 阅读(571) 评论(0) 推荐(0) 编辑
摘要: 概述本系列由两篇文章组成,介绍了当前用于 Linux 操作系统上的几种零拷贝技术,简单描述了各种零拷贝技术的实现,以及它们的特点和适用场景。本文是本系列文章的第一部分,主要是介绍一些零拷贝技术的相关背景知识,简要概述了 Linux 为什么需要零拷贝技术以及 Linux 中都有哪几种零拷贝技术。1评论... 阅读全文
posted @ 2015-04-30 23:43 苦逼码农2014 阅读(262) 评论(0) 推荐(0) 编辑
摘要: 终于可以写kafka的文章了,Mina的相关文章我已经做了索引,在我的博客中置顶了,大家可以方便的找到。从这一篇开始分布式消息系统的入门。在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题:l 我想分析一下用户行为(pageviews),以便我能设计出更好的广告位l 我想对用... 阅读全文
posted @ 2015-04-30 13:38 苦逼码农2014 阅读(189) 评论(0) 推荐(0) 编辑
摘要: 最近在进行监控平台的设计,之前一直觉得C/C++中最棘手的部分是内存的管理上,远不止new/delete、malloc/free这么简单。随着代码量的递增,程序结构复杂度的提高。各种内存方面的问题悄然滋生。而且作为平台,后期的插件扩展在所难免。长时间运行的采集平台的特性更是提出了对稳定性的高要求。不... 阅读全文
posted @ 2015-04-15 16:14 苦逼码农2014 阅读(188) 评论(0) 推荐(0) 编辑