03 2013 档案
摘要:我们都知道Maven本质上是一个插件框架,它的核心并不执行任何具体的构建任务,所有这些任务都交给插件来完成,例如编译源代码是由maven-compiler-plugin完成的。进一步说,每个任务对应了一个插件目标(goal),每个插件会有一个或者多个目标,例如maven-compiler-plugin的compile目标用来编译位于src/main/java/目录下的主源码,testCompile目标用来编译位于src/test/java/目录下的测试源码。用户可以通过两种方式调用Maven插件目标。第一种方式是将插件目标与生命周期阶段(lifecycle phase)绑定,这样用户在命令..
阅读全文
摘要:1. Sensei介绍Sensei是Linkin公司开发的一个开源分布式实时半结构化数据库,他主要支持以下功能(根据官网翻译):全文检索实时更新faceted searchkey-value查询在高并发更新与查询性能高支持与Hadoop集成初步的调研了以下该项目,发现他其实主要是在全文索引的基础封装了Browse Query Language (BQL,类似SQL)的查询语法,个人感觉该项目的优势主要是在以下几点:支持BQL语法相对与lucene的语法跟容易让人理解,而且对熟悉SQL的开发人员更友好。集群维护简单新加节点只要设置好节点本身的配置,启动后进程会自动加入集群,不需要修改其他服务器的
阅读全文
摘要:在未出现开源搜索引擎以前, Doug Cutting整了个Lucene, 随后Yonik Seeley写了一个Solr, 在2010年 Shay Banon发布了ElasticSearch, 大概在两年前, 我们迎来了Sensei, 最近他们发布了1.0版本, 下面通过@sematext对LinkedIn的搜索架构师John Wang的一个采访. 来大致了解一下Sensei. Sensei是什么?开源, 灵活, 实时, 分布式数据库, 原生支持搜索, 能操作非结构化文本和结构化数据. 它主要用户处理海量复杂半结构化查询和经常变化的数据结构. 它广泛用于支持LinkedIn.com的搜索功能.为
阅读全文
摘要:11.Solr1.1Features1.2Pros & Cons1.3References22.Senseidb2.1Features2.2Pros & Cons2.3为何没有直接用Solr?2.4References33.elasticsearch3.1Features3.2Pros & Cons3.3References44. Conclusion5其它参考文献比较的时候,主要关注以下几个方面:ClusteringScalability on Storage and ServiceHigh Availability ConsiderationsFeaturesFle
阅读全文
摘要:Groovy和Java的相同点有:3+, 4+, 6+, 8+, 10+, 12+, 13, 14, 15, 18+, 20+, 21, 22, 23, 28+, 29+, 30+, 31+, 32++表示Groovy不但涵盖了Java的语法,而且还有增强部分。Groovy和Java的不同点有:0, 1, 2, 5, 7, 9, 11, 16, 17, 19, 24, 25, 26, 27下面所列序号不分先后顺序:0. 在Groovy可以用def定义无类型的变量(定义变量方面def与JavaScript中的var相似),和返回值为无类型的方法,而在Java中没有def。Groovy:class
阅读全文
摘要:搭建该平台的目的就是为了运维、研发很方便的进行日志的查询。Kibana一个免费的web壳;Logstash集成各种收集日志插件,还是一个比较优秀的正则切割日志工具;Elasticsearch一个开源的搜索引擎框架(支持群集架构方式)。1 安装需求1.1理论拓扑1.2 安装环境1.2.1 硬件环境192.168.50.62(HP DL 385 G7 、RAM:12G、CPU:AMD 6128、DISK:SAS 146*4)192.168.50.98(HP DL 385 G7 、RAM:12G、CPU:AMD 6128、DISK:SAS 146*6)192.168.10.42 (Xen虚拟机、..
阅读全文
摘要:介绍如果你使用elasticsearch来存储你的日志,本文给你提供一些做法和建议。如果你想从多台主机向elasticsearch汇集日志,你有以下多种选择:Graylog2 安装在一台中心机上,然后它负责往elasticsearch插入日志,而且你可以使用它那个漂亮的搜索界面~Logstash 他有很多特性,包括你能输入什么日志,如何变换过滤,最好输出到哪里。其中就有输出到elasticsearch,包括直接输出和通过RabbitMQ的river方式两种。Apache Flume 这个也可以从海量数据源中获取日志,用”decorators”修改日志,也有各种各样的”sinks”来存储你的输出
阅读全文
摘要:最近开发一个数据同步的小功能,需要从A主机的Oracle数据库中把数据同步到B主机的Oracle库中。当然能够用dmp脚本或者SQL脚本是最好,但是对于两边异构的表结构来说,直接导入不可行。然后在需要实时同步的情况下用存储过程也不可行了。写一个数据同步的小程序是个不错的选择。使用框架的封装和连接池是必须的,Spring是首选,这里我们同样需要Spring的多数据源连接配置方式。 其实再进行项目开发的时候,一个项目有可能不止用到一个数据源,为了提高数据库的水平伸缩性,需要对多个数据库实例进行管理,需要配置多数据源。 本文以Spring2.5 + Oracle10g 为例配置和使用多数据源...
阅读全文