随笔档案「2016年11月」 - XIAO的博客

Kafka Shell基本命令（包括topic的增删改查）

摘要：转载请注明出处：http://www.cnblogs.com/xiaodf/ 创建kafka topic 查看所有topic列表查看指定topic信息控制台向topic生产数据控制台消费topic的数据查看topic某分区偏移量最大（小）值增加topic分区数删除topic，慎用，只会删阅读全文

posted @ 2016-11-23 13:09 XIAO的博客阅读(166746) 评论(1) 推荐(7)

修改hive分区表，在分区列前增加一个字段

摘要：本文主要为了测试，在有数据的分区表中增加新的一个非分区字段后，新数据加入表中是否正常。原始数据创建分区表导入数据给表增加一列message 新数据导入新数据结论新数据正常加入表中，不用删除老数据，不过老数据对应新字段的值为null 阅读全文

posted @ 2016-11-23 11:52 XIAO的博客阅读(5538) 评论(1) 推荐(1)

Kafka Topic ISR不全，个别Spark task处理时间长

摘要：现象 Spark streaming读kafka数据做业务处理时，同一个stage的task,有个别task的运行时间比多数task时间都长，造成业务延迟增大。查看业务对应的topic发现当topic isr不足时，会出现个别task运行时间过长的现象. 原因和大部分分布式系统一样，Kafka处阅读全文

posted @ 2016-11-22 19:12 XIAO的博客阅读(5008) 评论(0) 推荐(0)

Kerberos简介及常见问题

摘要：基本描述 Kerberos 使用Needha Schroeder协议作为它的基础。它使用了一个由两个独立的逻辑部分：认证服务器和票据授权服务器组成的"可信赖的第三方"，术语称为密钥分发中心（KDC）。 Kerberos 工作在用于证明用户身份的"票据"的基础上。 KDC持有一个密钥数据库；每个网络实阅读全文

posted @ 2016-11-15 18:14 XIAO的博客阅读(6285) 评论(0) 推荐(0)

【转载】Spark性能优化指南——高级篇

摘要："前言" "数据倾斜调优" "调优概述" "数据倾斜发生时的现象" "数据倾斜发生的原理" "如何定位导致数据倾斜的代码" "查看导致数据倾斜的key的数据分布情况" "数据倾斜的解决方案" "解决方案一：使用Hive ETL预处理数据" "解决方案二：过滤少数导致倾斜的key" "解决方案三：提高阅读全文

posted @ 2016-11-11 22:09 XIAO的博客阅读(3501) 评论(0) 推荐(2)

【转载】 Spark性能优化指南——基础篇

摘要：转自：http://tech.meituan.com/spark tuning basic.html?from=timeline "前言" "开发调优" "调优概述" "原则一：避免创建重复的RDD" "原则二：尽可能复用同一个RDD" "原则三：对多次使用的RDD进行持久化" "原则四：尽量避免使阅读全文

posted @ 2016-11-11 20:45 XIAO的博客阅读(1184) 评论(0) 推荐(0)

Sqoop使用手册

摘要：转载请注明出处：http://www.cnblogs.com/xiaodf/ "1 Sqoop概述" "2 版本说明" "3 驱动安装" "3.1 MySQL" "4 基本用法" "4.1 导入" "4.1.1 保护密码" "4.1.2 使用其他文件格式" "4.1.3 压缩导入的数据" "4.1 阅读全文

posted @ 2016-11-04 15:41 XIAO的博客阅读(18569) 评论(1) 推荐(3)

kafka性能基准测试

摘要：转载请注明出处：http://www.cnblogs.com/xiaodf/ 1、测试环境该benchmark用到了六台机器，机器配置如下 l IntelXeon 2.5 GHz processor with six cores l Six7200 RPM SATA drives l 32GB o 阅读全文

posted @ 2016-11-02 16:50 XIAO的博客阅读(27167) 评论(3) 推荐(4)

Flume NG安装部署及数据采集测试

摘要：转载请注明出处：http://www.cnblogs.com/xiaodf/ Flume作为日志收集工具，监控一个文件目录或者一个文件，当有新数据加入时，采集新数据发送给消息队列等。 1 安装部署Flume 若要采集数据节点的本地数据，每个节点都需要安装一个Flume工具，用来做数据采集。 1.1 阅读全文

posted @ 2016-11-02 16:39 XIAO的博客阅读(3608) 评论(0) 推荐(0)

XIAO的博客

11 2016 档案