上一页 1 ··· 49 50 51 52 53

Lucene in action 笔记 analysis篇

摘要: Analysis, in Lucene, is the process of converting field text into its most fundamental indexed representation, terms.这个分析的步骤不一定的, 一般会包含如下:extracting words, discarding punctuation, removing accents from characters, lowercasing (also called normalizing), removing common words, reducing words to a root 阅读全文
posted @ 2011-07-04 20:21 fxjwind 阅读(664) 评论(0) 推荐(0) 编辑

Lucene in action 笔记 search篇

摘要: 一. 用lucene怎么完成search1. 创建IndexSearcherIndexSearcher searcher = new IndexSearcher(directory);2. 生成需要搜索的词Term t = new Term("subject", "ant");3. 创建查询Query query = new TermQuery(t);4. search并得到结果Hits hits = searcher.search(query);此处的query就简单的由term生成的, 对于复杂的query需要用QueryParser来生成Query 阅读全文
posted @ 2011-07-04 20:15 fxjwind 阅读(279) 评论(0) 推荐(0) 编辑

Lucene in action 笔记 index篇

摘要: 一. Index之前要做什么1. 将要index的内容转化为文本你要处理的文件可能是PDF, word, html, OK通通转化成文本, lucene只能处理文本2.分析文本在index之前, 必须对文本做一系列的分析, 对文本的token化, 就是分词. 然后滤掉一些没有区分度的词, 如stop word这个地方涉及语言相关性. 不同语言的处理会不同. 英文还要处理大小写, 派生词. 这一步对于index非常重要, 所以在lucene中选取和开发合适的analysizor是关键的一步.3. 写入index这步就是真正的去做index了,lucene采用的是inverted index, 即 阅读全文
posted @ 2011-07-04 20:12 fxjwind 阅读(553) 评论(0) 推荐(0) 编辑

数论(算法概述)

摘要: 1. 模运算模运算很有用, 最常用的是钟表.还有二进制负数的补码, 有2n 个数, [-2n-1 , 2n-1 -1]正数当然直接表示成2进制即可, 对于负数就需要用补码, 即[1, 2n-1 ] 的二进制表示的取反再加一.以前对这个补码不理解, 所以也一直记不住, 其实:Any number in the range -2n-1 to 2n-1 - 1 is stored modulo 2n. Negative numbers -x therefore end up as 2n -x.原来如此.模运算对于加,减,乘,指数运算, 都很容易理解, 也都可以先进行模运算再加减乘. 就是除比较复杂, 阅读全文
posted @ 2011-07-04 20:04 fxjwind 阅读(594) 评论(0) 推荐(0) 编辑

关于Restful Web Service的一些理解

摘要: 对于restful web service,刚开始确实是个不太好理解的概念。 看了些文章,总是在描述和解释restful的原则: 1)显式地使用HTTP方法。 2)无状态。 3)公开目录结构式的 URI。 4)传输 XML、JavaScript Object Notation (JSON),或同时传输这两者。 可是为什么要这样, 除了这种web service还有没有其他类型的web service?等问题仍难比较糊涂。 直到看了这篇文章:http://www.ibm.com/developerworks/cn/webservices/0907_rest_soap/ 感觉有点明白了,又去看了一 阅读全文
posted @ 2011-07-04 19:43 fxjwind 阅读(643) 评论(0) 推荐(0) 编辑

博客园开博记录

摘要: 从CSDN来博客园开个博 Cao, W., Gao, Y., Lin, B., Feng, X., Xie, Y., Lou, X., & Wang, P. (2018, May). Tcprt: Instrument and diagnostic analysis system for servi 阅读全文
posted @ 2011-07-04 14:04 fxjwind 阅读(248) 评论(0) 推荐(0) 编辑
上一页 1 ··· 49 50 51 52 53