飞飞飞——998

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2019年11月12日

摘要: 过去两年,我的主要工作都在Hadoop这个技术栈中,而最近有幸接触到了Ceph。我觉得这是一件很幸运的事,让我有机会体验另一种大型分布式存储解决方案,可以对比出HDFS与Ceph这两种几乎完全不同的存储系统分别有哪些优缺点、适合哪些场景。 对于分布式存储,尤其是开源的分布式存储,站在一个SRE的角度 阅读全文
posted @ 2019-11-12 16:59 飞飞飞——998 阅读(582) 评论(0) 推荐(0) 编辑

2019年6月18日

摘要: 前提 本文的分析基于kafka 0.9版本的client, 0.10.1.0中已经修改心跳线程为后台线程,并支持设置max.poll.records,参见ChangeLog。 使用场景 Kafka是一个高吞吐量的分布式消息系统,在APM的移动端请求数据的处理中,使用了Kafka。Kafka数据使用多 阅读全文
posted @ 2019-06-18 17:05 飞飞飞——998 阅读(3922) 评论(0) 推荐(0) 编辑

2019年5月20日

摘要: 一直以来都想写一点关于kafka consumer的东西,特别是关于新版consumer的中文资料很少。最近Kafka社区邮件组已经在讨论是否应该正式使用新版本consumer替换老版本,笔者也觉得时机成熟了,于是写下这篇文章讨论并总结一下新版本consumer的些许设计理念,希望能把consume 阅读全文
posted @ 2019-05-20 17:07 飞飞飞——998 阅读(465) 评论(0) 推荐(0) 编辑

摘要: Kafka保证同一consumer group中只有一个consumer会消费某条消息,实际上,Kafka保证的是稳定状态下每一个consumer实例只会消费某一个或多个特定的数据,而某个partition的数据只会被某一个特定的consumer实例所消费。这样设计的劣势是无法让同一个consume 阅读全文
posted @ 2019-05-20 15:47 飞飞飞——998 阅读(6184) 评论(0) 推荐(0) 编辑

2019年5月16日

摘要: Kafka的基本介绍 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志、访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开 阅读全文
posted @ 2019-05-16 16:20 飞飞飞——998 阅读(188) 评论(0) 推荐(0) 编辑

2018年12月18日

摘要: 一、概述 从整个HDFS系统架构上看,NameNode是其中最重要、最复杂也是最容易出现问题的地方,而且一旦NameNode出现故障,整个Hadoop集群就将处于不可服务的状态,同时随着数据规模和集群规模地持续增长,很多小量级时被隐藏的问题逐渐暴露出来。所以,从更高层次掌握NameNode的内部结构 阅读全文
posted @ 2018-12-18 17:06 飞飞飞——998 阅读(140) 评论(0) 推荐(0) 编辑

摘要: HDFS Federation在美团点评的应用与改进 美团点评离线存储团队 ·2017-04-14 19:49 一、背景 2015年10月,经过一段时间的优化与改进,美团点评HDFS集群稳定性和性能有显著提升,保证了业务数据存储量和计算量爆发式增长下的存储服务质量;然而,随着集群规模的发展,单组Na 阅读全文
posted @ 2018-12-18 16:00 飞飞飞——998 阅读(151) 评论(0) 推荐(0) 编辑

2018年12月6日

摘要: 1. Ceph架构简介及使用场景介绍 1.1 Ceph简介 Ceph是一个统一的分布式存储系统,设计初衷是提供较好的性能、可靠性和可扩展性。 Ceph项目最早起源于Sage就读博士期间的工作(最早的成果于2004年发表),并随后贡献给开源社区。在经过了数年的发展之后,目前已得到众多云计算厂商的支持并 阅读全文
posted @ 2018-12-06 16:29 飞飞飞——998 阅读(2779) 评论(0) 推荐(0) 编辑