05 2015 档案

摘要:1. 背景介绍 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征: (1) 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦; (2) 支持近实时的在线分析系统和类似于Hadoop之类的... 阅读全文
posted @ 2015-05-15 17:21 唐僧吃肉 阅读(253) 评论(0) 推荐(0) 编辑
摘要:摘要: (1)kafka和flume都是日志系统。kafka是分布式消息中间件,自带存储,提供push和pull存取数据功能。flume分为agent(数据采集器),collector(数据简单处理和写入),storage(存储器)三部分,每一部分都是可以定制的。比如agent采用RPC(Th... 阅读全文
posted @ 2015-05-15 17:20 唐僧吃肉 阅读(270) 评论(0) 推荐(0) 编辑
摘要:elasticsearch 摘要: 1 es是一个分布式全文搜索引擎。特定是:无中心化,实时,扩展性强。 2. es有几个好的概念或者特点:(1)cluster 集群无中心化。(2)shards。分片,通过分片实现分布式。(3)通过快照的方式实现方便的备份和恢复。 ... 阅读全文
posted @ 2015-05-14 21:59 唐僧吃肉 阅读(245) 评论(0) 推荐(0) 编辑
摘要:摘要:es可以通过简单的命令对索引或者整个集群进行快照和恢复 快照和恢复 Snapshot and restore 模块允许创建单个索引或者整个集群的快照到远程仓库. 在初始版本里只支持共享文件系统的仓库,但是现在通过官方的仓库插件可以支持各种各样的后台仓库。 仓库 在进行任... 阅读全文
posted @ 2015-05-14 21:48 唐僧吃肉 阅读(725) 评论(0) 推荐(0) 编辑