摘要: 使用Spark构建索引非常简单,因为spark提供了更高级的抽象rdd分布式弹性数据集,相比以前的使用Hadoop的MapReduce来构建大规模索引,Spark具有更灵活的api操作,性能更高,语法更简洁等一系列优点。 先看下,整体的拓扑图: 然后,再来看下,使用scala写的spark程序: J 阅读全文
posted @ 2016-02-01 13:52 三劫散仙 阅读(1177) 评论(0) 推荐(0) 编辑
摘要: 环境如下: Centos6.5 Apache Hadoop2.7.1 Apache Hbase0.98.12 Apache Zookeeper3.4.6 JDK1.7 Ant1.9.5 Maven3.0.5 最近在测Hbase的压缩,Hadoop安装了lzo和snappy,插入50条文本数据,每条数... 阅读全文
posted @ 2016-01-06 10:11 三劫散仙 阅读(4518) 评论(1) 推荐(0) 编辑
摘要: 首先要明确一点,ElasticSearch是基于Lucene的,它的很多基础性组件,都是由Apache Lucene提供的,而es则提供了更高层次的封装以及分布式方面的增强与扩展。所以要想熟练的掌握的关于es中分词方面的知识,一定得先从Lucene抓起,否则只会是丈二和尚摸不着头脑,当然我们大多数开... 阅读全文
posted @ 2015-11-23 20:10 三劫散仙 阅读(5479) 评论(0) 推荐(0) 编辑
摘要: 关于NameNode高可靠需要配置的文件有core-site.xml和hdfs-site.xml关于ResourceManager高可靠需要配置的文件有yarn-site.xml逻辑结构:NameNode-HA工作原理:在一个典型的HA集群中,最好有2台独立的机器的来配置NameNode角色,无论在... 阅读全文
posted @ 2015-11-11 20:02 三劫散仙 阅读(2417) 评论(0) 推荐(0) 编辑
摘要: (一)logstash是什么? logstash是一种分布式日志收集框架,开发语言是JRuby,当然是为了与Java平台对接,不过与Ruby语法兼容良好,非常简洁强大,经常与ElasticSearch,Kibana配置,组成著名的ELK技术栈,非常适合用来做日志数据的分析。 当然它可以单独出现,作... 阅读全文
posted @ 2015-11-05 10:50 三劫散仙 阅读(3359) 评论(0) 推荐(0) 编辑
摘要: ELK是什么? E=ElasticSearch ,一款基于的Lucene的分布式搜索引擎,我们熟悉的github,就是由ElastiSearch提供的搜索,据传已经有10TB+的数据量。 L=LogStash , 一款分布式日志收集系统,支持多输入源,并内置一些过滤操作,支持多输入元 K=Kiban... 阅读全文
posted @ 2015-10-21 14:33 三劫散仙 阅读(3677) 评论(0) 推荐(0) 编辑
摘要: 有时候,我们对运行几天或者几个月的hadoop或者hbase集群做停止操作,会发现,停止命令不管用了,为什么呢?因为基于java开发的程序,想要停止程序,必须通过进程pid来确定,而hadoop和hbase默认的情况下,会把pid文件存储在Linux上的/tmp目录的某个目录下,进程名命令规则一般是... 阅读全文
posted @ 2015-10-20 13:45 三劫散仙 阅读(1843) 评论(0) 推荐(0) 编辑
摘要: Spark简介 Spark是加州大学伯克利分校AMP实验室(Algorithms, Machines, and People Lab)开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目,8个月后成为Apache顶级项目,速度之快足见过人之处,Spark以其先进的设计理念... 阅读全文
posted @ 2015-08-05 19:37 三劫散仙 阅读(3556) 评论(0) 推荐(1) 编辑
摘要: JVM是JAVA世界的核心,了解它有助于我们更好调试,调优和开发程序,最近散仙在看JAVA特种兵一书,看完觉得,作者写的内容还是挺不错,大家感兴趣的,也可以购买本温故而知新下。在JVM中,我们经常提到的就是堆了,堆确实很重要,其实,除了堆之外,还有几个重要的模块,看下图:大多数情况下,我们并不需要关... 阅读全文
posted @ 2015-04-06 21:07 三劫散仙 阅读(233) 评论(0) 推荐(0) 编辑
摘要: 记录下最近两天散仙在工作中遇到的有关Pig0.12.0和Solr4.10.2一些问题,总共有3个,如下: (1)问题一: 如何Pig中使用ASCII和十六进制(hexadecimal)的分隔符进行加载,和切分数据? 注意关于这个问题,在Pig中,会反应到2个场景中, 第一: 在Pig加载(load)... 阅读全文
posted @ 2015-04-02 13:44 三劫散仙 阅读(355) 评论(0) 推荐(0) 编辑