上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 23 下一页
摘要: 1. 介绍 2. 实验说明 2.1 实验环境 2.2 实验方法 2.3 实验负载 3. MapReduce on alluxio 3.1 读取10G文件(1G split) 3.2 读取20G文件(1G split) 3.3 读取60G文件(1G split) 3.4 读取60G文件(512MB s 阅读全文
posted @ 2016-12-16 12:08 XGogo 阅读(2485) 评论(0) 推荐(0) 编辑
摘要: 转自:http://kaimingwan.com/post/alluxio/spark-on-alluxiohe-mr-on-alluxioce-shi-gai-jin-ban 1. 介绍 2. 准备数据 2.1 清空系统缓存 3. MR测试 3.1 MR without alluxio 3.2 M 阅读全文
posted @ 2016-12-16 12:07 XGogo 阅读(1294) 评论(0) 推荐(0) 编辑
摘要: 1. 介绍 2. 准备工作 2.1 tcpdump 2.2 winshark 2.3 安装iftop 2.4 alluxio网络通信相关的端口 3.iftop 锁定消耗流量最大的端口 4. dump数据 5. winshark中加载看看 1. 介绍 最近在使用alluxio的时候发现了网络流量比较大 阅读全文
posted @ 2016-12-16 12:02 XGogo 阅读(686) 评论(0) 推荐(0) 编辑
摘要: 转自:http://kaimingwan.com/post/alluxio/effective-spark-rdds-with-alluxio 1. 介绍 2. 引言 3. Alluxio and Spark RDD Cache 4. 保存RDD 4.1 采用persist() 4.2 采用save 阅读全文
posted @ 2016-12-16 11:59 XGogo 阅读(498) 评论(0) 推荐(0) 编辑
摘要: 1. hbase sink介绍 1.1 HbaseSink 1.2 AsyncHbaseSink 2. 配置flume 3. 运行测试flume 4. 使用RegexHbaseEventSerializer来处理些HBASE的值 5. 效率测试 1. hbase sink介绍 1.1 HbaseSi 阅读全文
posted @ 2016-12-16 11:49 XGogo 阅读(7259) 评论(2) 推荐(0) 编辑
摘要: 基于ThriftSource,MemoryChannel,HdfsSink三个组件,对Flume数据传输的事务进行分析,如果使用的是其他组件,Flume事务具体的处理方式将会不同。 Flume的事务处理原理: Flume在对Channel进行Put和Take操作的时候,必须要用事物包住,比如: Ch 阅读全文
posted @ 2016-12-16 11:47 XGogo 阅读(1442) 评论(0) 推荐(0) 编辑
摘要: 转:http://www.data321.com/yunjisuan/20160514880/SolrZhiJieDuQuZKZhongDePeiZhiXin SolrCloud之分布式索引及与Zookeeper的集成 作者:Wang, Josh 一、概述 Lucene是一个Java语言编写的利用倒 阅读全文
posted @ 2016-12-06 17:17 XGogo 阅读(1260) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/f1194361820/p/6108025.html Kafka Connect 简介 Kafka Connect 是一个可以在Kafka与其他系统之间提供可靠的、易于扩展的数据流处理工具。使用它能够使得数据进出Kafka变得很简单。Kafka C 阅读全文
posted @ 2016-12-06 16:38 XGogo 阅读(2373) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/f1194361820/p/6054148.html Kafka Consumer 通过之前的架构介绍,对Consumer有了一个初步的了解。这里再深入一点来了解一下Consumer。 1、Consumer Group与Topic订阅 1.1 Co 阅读全文
posted @ 2016-12-06 16:37 XGogo 阅读(699) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/f1194361820/p/6048429.html 通过前面的架构简述,知道了Producer是用来产生消息记录,并将消息以异步的方式发送给指定的topic的某个partition的。另外还知道,它保证了消息的有序的发送。那么它是如何做到这些的呢 阅读全文
posted @ 2016-12-06 16:33 XGogo 阅读(1527) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 23 下一页