郑文亮 - 博客园

2013年12月25日

摘要：我在百X知道上回答问题时经常遇到类似与这样的问题：MongoDB有没有像MySQL一样的ODBC驱动？MongoDB能不能像MySQL一样获取字段名称或类型。我的回答是：不行，因为MongoDB不是MySQL。这个回答显得MongoDB太弱了，我的原意是你不能要求一个物理优秀教师帮你辅导数学，也许他能做到基本的教学，但他很难做到优秀数学教师那么全面。今天讨论的问题是：批量插入和批量查询昨天在百X知道上有人问起MongoDB的批量插入如何写，这个我还真没用过，一方面MongoDB的速度足够快让我从来没有想过去找这种方法，另一方面MongoDB的官网以及API里也找不到这种方法。那就带来两个问题。阅读全文

posted @ 2013-12-25 16:39 郑文亮阅读(4439) 评论(0) 推荐(0)

Apache Thrift - 可伸缩的跨语言服务开发框架

摘要：简介：Apache Thrift 是 Facebook 实现的一种高效的、支持多种编程语言的远程服务调用的框架。本文将从 Java 开发人员角度详细介绍 Apache Thrift 的架构、开发和部署，并且针对不同的传输协议和服务类型给出相应的 Java 实例，同时详细介绍 Thrift 异步客户端的实现，最后提出使用 Thrift 需要注意的事项。发布日期：2012 年 1 月 16 日级别：中级访问情况：31460 次浏览评论：9(查看|添加评论- 登录)平均分 (73个评分) 为本文评分前言：目前流行的服务调用方式有很多种，例如基于 SOAP 消息格式的 Web Service，阅读全文

posted @ 2013-12-25 16:01 郑文亮阅读(403) 评论(0) 推荐(0)

Lucene 4.x实践1

摘要：在Lucene 3.x时代，《Lucene In Action》是一本相当不错的参考书，书中详细介绍了Lucene各种高级使用技术，对于开发者来说非常实用。但是近期Lucene升级到了4.x版本，在性能等各方面有了很大的提高，值得在新项目中使用。然而Lucene 4.x中的API相比3.x来说有了很大的改变，《Lucene In Action》中的很多内容都已经过时了，并且由于4.x推出的时间不长，还没有比较好的文档来对用法进行说明，这个系列文章就是想记录下自己使用Lucene 4.x的经验体会，供大家参考使用。由于现在网络搜索都希望达到实时搜索的效果，用户上传文章后，希望立即在搜索结果中可见阅读全文

posted @ 2013-12-25 14:07 郑文亮阅读(668) 评论(0) 推荐(0)

传智播客课程——Lucene搜索引擎

摘要： Lucene不是一个现成的程序，类似文件搜索程序或web网络爬行器或是一个网站的搜索引擎。Lucene是一个软件库，一个开发工具包，而不是一个具有完整特征的搜索应用程序。它本身只关注文本的索引和搜索。Lucene使你可以为你的应用程序添加索引和搜索能力。目前已经有很多应用程序的搜索功能是基于 Lucene 的，比如 Eclipse 的帮助系统的搜索功能。Lucene 采用的是一种称为反向索引（inverted index）的机制。反向索引就是说我们维护了一个词/短语表，对于这个表中的每个词/短语，都有一个链表描述了有哪些文档包含了这个词/短语。这样在用户输入查询条件的时候，就能非常快的得到搜索阅读全文

posted @ 2013-12-25 13:26 郑文亮阅读(2275) 评论(0) 推荐(0)

2013年12月24日

小菜学习Lucene.Net(更新3.0.3版本使用)

摘要：花了两天的时间研究了下Lucene.Net 发现确实挺好玩.... 最新版本是3.0.3 (最后更新时间2012-10) 可惜3.0.3版本的Lucene.net无法和盘古分词 (最新版为2.3.1.0 最后更新时间 2010-10)一起使用.....因为盘古分词基于2.9.x.x版本写的 ,在 3.0.3中很多接口和类名发生了变化..(当然网上也有解决方案 :基于新的接口重新编译盘古分词) 今天主要用的是 Lucene.Net 2.9.2.2 与盘古分词 2.3.0.0版本. 主要功能就是创建索引,和搜索下面贴出 2段代码创建索引: View Cod... 阅读全文

posted @ 2013-12-24 11:57 郑文亮阅读(3305) 评论(6) 推荐(2)

2013年12月23日

c# mongo 返回指定的列

摘要： var query= db.GetCollection("merchant").Find(Query.EQ(m => m.Id, id)) .SetFields(Fields.Include(m => m.Address).Include(m => m.Name)); 阅读全文

posted @ 2013-12-23 11:37 郑文亮阅读(650) 评论(0) 推荐(0)

2013年12月21日

如何提高Lucene构建索引的速度

摘要：如何提高Lucene构建索引的速度 hans(汉斯) 2013-01-27 10:12对于Lucene>=2.3：IndexWriter可以自行根据内存使用来释放缓存。调用writer.setRAMBufferSizeMB()方法设置缓存尺寸。确保你没有任何的遗留代码调用setMaxBufferedDocs方法，因为写入器可以根据两种情况一起释放缓存（哪个更早发生）。使用你可以提供的全部内存。在释放缓存之前使用更多的内存，意味着Lucene写入更大的段，意味着延迟合并的发生。LUCENE-843中的测试发现，针对所测内容集合48MB内存是最优值，但是，你的应用可能有不同的最优值。关闭复合阅读全文

posted @ 2013-12-21 16:03 郑文亮阅读(718) 评论(0) 推荐(0)

完整的站内搜索Demo(Lucene.Net+盘古分词)

摘要：前言首先自问自答几个问题,以让各位看官了解写此文的目的什么是站内搜索？与一般搜索的区别？很多网站都有搜索功能,很多都是用SQL语句的Like实现的,但是Like无法做到模糊匹配（例如我搜索“.net学习”,如果有“.net的学习”,Like就无法搜索到，这明显不符合需求,但是站内搜索就能做到）,另外Like会造成全盘扫描,会对数据库造成很大压力，为什么不用数据库全文检索，跟普通SQL一样,很傻瓜,灵活性不行为什么不用百度、google的站内搜索？毕竟是别人的东西,用起来肯定会受制于人（哪天你的网站火了,它看你不爽了,就可能被K）,主要还是索引的不够及时,网站新的内容,需要一定时间才能.. 阅读全文

posted @ 2013-12-21 15:16 郑文亮阅读(545) 评论(1) 推荐(0)

Lucene多字段搜索

摘要：最近在学习Lucene的过程中遇到了需要多域搜索并排序的问题，在网上找了找，资料不是很多，现在都列出来，又需要的可以自己认真看看，都是从其他网站粘贴过来的，所以比较乱，感谢原创的作者们！使用MultiFieldQueryParser类即可。示例代码：Java代码packagecom.lucene.search;importjava.io.File;importjava.io.IOException;54com.cnimportorg.apache.lucene.analysis.standard.StandardAnalyzer;importorg.apache.lucene.queryPa 阅读全文

posted @ 2013-12-21 09:26 郑文亮阅读(8104) 评论(1) 推荐(0)

Lucene的多域查询、结果中查询、查询结果分页、高亮查询结果和结果评分

摘要： 1.针对多个域的一次性查询1.1.三种方案使用lucene构造搜索引擎的时候，如果要针对多个域进行一次性查询，一般来说有三种方法：第一种实现方法是创建多值的全包含域的文本进行索引，这个方案最简单。但是这个防范有个缺点：你不能直接对每个域的加权进行控制。第二种方法是使用MultiFieldQueryParser，它是QueryParser的子类，它会在后台程序中实例化一个QueryParser对象，用来针对每个域进行查询表达式的解析，然后使用BooleanQuery将查询结果合并起来。当程序向BooleanQuery添加查询子句时，默认操作符OR被用于最简单的解析方法中。为了实现... 阅读全文

posted @ 2013-12-21 09:23 郑文亮阅读(9865) 评论(2) 推荐(3)

公告