摘要:
遍历文件夹 关键函数--递归法1 2 void CFileSearchDlg::TraverseFolder( const CString& strDir,std::vector<CString>& vecFile ) 3 { 4 WIN32_FIND_DATA FindFileData; 5 6 CString strDirTmp; 7 strDirTmp = strDir; 8 strDirTmp += "\\*.*"; 9 10 HANDLE hFind=::FindFirstFile(strDirTmp,&FindFileData 阅读全文
摘要:
Since the emerging of Hadoop implementation, I have been trying to morph existing algorithms from various areas into the map/reduce model. The result is pretty encouraging and I've found Map/Reduce is... 阅读全文
摘要:
原文出处:http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html 由于 Solr 默认的 Query Parser 生成的 Query 一般是 “短语查询”,导致只有很精确的结果才被搜索出来。大部分时候我们要分词后的 BooleanQuery。一年半前有篇关于 solr 使用自定义... 阅读全文
摘要:
原文出处:http://blog.chenlb.com/2010/08/get-solr-analysis-word.html Solr 1.3 只有 AnalysisRequestHandler 处理器,只能提交文档来观察文档的分词结果。 Solr 1.4 有了对字段的分词。FieldAnalysisRequestHandler 可以对某个字段或字段类型的分词器对查询串取到分词数据。 用 solr 的默认配置,如 solr 1.4.1。 我用 mmseg4j 为例。在 solr.root/example/solr/conf/schema.xml 的 types 元素内... 阅读全文
摘要:
原文出处:http://blog.chenlb.com/2010/08/solr-with-log4j.html Solr 默认是用 Jdk 的日志输出。还好 Solr 是使用 slf4j 日志库,可以方便换用其它日志输出。solr 使用 log4j 也不难。重新生成 solr.war 把 solr.war 解压,然后把 log4j.properties 放到 WEB-INF/... 阅读全文
摘要:
作者: 阮一峰 日期: 2010年8月17日 海底光缆是国际互联网的骨架。光缆的多少,代表一国与互联网的联系是否紧密。 有人利用微软的Bing地图,以及wikipedia的数据,做出了一幅互动式的世界海底光缆分布图。真是厉害啊。 我见过的这类地图中,它是最好用的一个。 从地图上可以看到,中国大陆的海底光缆连接点只有三个,因此非常容易对出入境的信息进行控制。 第一个是青岛(2条光缆)。 第二个是... 阅读全文
摘要:
本文将介绍Solr查询中涉及到的Cache使用及相关的实现。Solr查询的核心类就是SolrIndexSearcher,每个core通常在 同一时刻只由当前的SolrIndexSearcher供上层的handler使用(当切换SolrIndexSearcher时可能会有两个同时提供服 务),而Solr的各种Cache是依附于SolrIndexSearcher的,SolrIndexSearcher在... 阅读全文
摘要:
Lucene是个高度优化的倒转索引搜索引擎。它将倒转的索引存储在定制的文件格式中,文件格式被高度优化以确保能被搜索器快速的加载以及有效的搜索。Lucene产生这些结构以致索引几乎完全的被预先计算好 Lucene 通过使用Directory接口的实现来存储索引,注意不要将Directory与java.io混淆了.FSDirectory 是Directory接口的一个标准的实现,它将索引保存在文件系... 阅读全文
摘要:
个人定义的移动视觉搜索是指:以移动终端捕获的图像作为检索项,通过互联网检索感兴趣信息的一种信息检索方式。 目前,我看到了5个提供移动视觉搜索服务的公司:分别是google goggles, amazon snaptell, nokia point&find, kooaba和oMoby。如下图。(图片来自cvpr2010,点击查看论文) google goggles我感觉是个里程碑式的应用程... 阅读全文
摘要:
【前言】 应朋友们的要求,我还是写一篇关于服务器日志法进行网站分析的原理以及它的优缺点是什么。请朋友们注意,网站服务器日志法并不容易进行,初学者,以及在绝大多数情况下,进行以用户行为分析为核心的网站分析,用不到服务器日志法。不过,作为网站分析历史不可分割的一部分以及重要的基础篇章,服务器日志法仍然值得一书。下面的这篇文章也是我要撰写的书中截取的内容(我要快马加鞭快快写了,已经辜负了太多朋友的重... 阅读全文