摘要: 一,信息检索的过程简介 全文检索和数据库应用最大的不同在于:让最相关的头100条结果满足98%以上用户的需求 1,构建文本库 在开发功能前,一个信息检索系统需要做些准备工作,首先,必须要构建一个文本数据库,这个文本数据库用来保存所有用户可能检索的信息。在这些信息的基础上,确定索引中 的文本类型,文本类型是被系统所认可的一种信息格式,这种格式应当具有可识别,冗余程度低的特点。一旦文本模型确定下来后... 阅读全文
posted @ 2009-07-27 09:20 周骏 阅读(644) 评论(0) 推荐(0) 编辑
摘要: 在lucene.net中,典型的索引文件操作代码如下: IndexWriter writer = new IndexWriter("c:\index", new StandardAnalyzer(), true); try { Document doc = new Document(); doc.Add(Field.Keyword("name", "name name"); doc.Add(Fie... 阅读全文
posted @ 2009-07-27 09:19 周骏 阅读(656) 评论(0) 推荐(0) 编辑
摘要: 其实 Lucene.net 对数据库建索引很简单,只要把数据表里面的记录读出来,然后对每个字段索引就行了.本文中数据库的内容是某个博客表-userblog表。 1.表结构: 字段名称 字段类型 字段含义 id Varchar(11) 编号 title Varchar(50) 标题 content Text 内容 2.程序流程 1) 打开数据库; 2) 建立索引; 3) 根据索引进行全文搜索. 4... 阅读全文
posted @ 2009-07-27 09:18 周骏 阅读(708) 评论(0) 推荐(0) 编辑
摘要: Lucene.net是目前在.net环境中被普遍使用的全文索引的开源项目,这次在项目的开发中也使用它进行全文索引。 在开发过程中碰到一些小问题就是对多字段和多索引目录进行搜索。 1、多字段搜索就是同时要一个以上的字段中的内容进行比较搜索,类似概念在SQL中就是select * from Table where a like '%query%' or b like '%query%'。 Lucen... 阅读全文
posted @ 2009-07-27 09:17 周骏 阅读(649) 评论(0) 推荐(1) 编辑
摘要: 1. 有时对于一个Document来说,有一些Field会被频繁地操作,而另一些Field则不会。这时可以将频繁操作的Field和其他Field分开存 放,而在搜索时同时检索这两部分Field而提取出一个完整的Document。 这要求两个索引包含的Document的数量必须相同。 在创建索引的时候,可以同时创建多个IndexWriter,将一个Document根据需要拆分成多个包含部分Field... 阅读全文
posted @ 2009-07-27 09:15 周骏 阅读(510) 评论(0) 推荐(0) 编辑
摘要: 在编写多线程程序时无可避免会遇到线程的同步问题。什么是线程的同步呢?   举个例子:如果在一个公司里面有一个变量记录某人T的工资count=100,有两个主管A和B(即工作线程)在早一些时候拿了这个变量的值回去,过 了一段时间A主管将T的工资加了5块,并存回count变量,而B主管将T的工资减去3块,并存回count变量。好了,本来T君可以得到102块的工资 的,现在就变成98块了。这就是线程同... 阅读全文
posted @ 2009-07-27 09:13 周骏 阅读(393) 评论(0) 推荐(0) 编辑
摘要: 判断jquery对象是否可见 2008年10月09日 星期四 上午 09:12 if ($("p").is(":visible")){...} 阅读全文
posted @ 2009-07-27 09:10 周骏 阅读(3361) 评论(0) 推荐(0) 编辑
摘要: //blog.js var blog = {};//初始化命名空间 blog.utility = { Version : 'blog.utility version 0.0.1', sayHello: function (str) { alert('hello : '+str +' by ' + this.getVersion()); }, getVersion :function () { r... 阅读全文
posted @ 2009-07-27 09:07 周骏 阅读(259) 评论(0) 推荐(0) 编辑
摘要: 1. Make fewer HTTP requests 尽可能少的http请求。。我们有141个请求(其中15个JS请求,3个CSS请求,47个CSS background images请求),多的可怕。思考了下,为什么把这个三种请求过多列为对页面加载的重要不利因素呢,而过多的IMG请求并没有列为不利因素呢? 发现原来这些请求都是可以避免的。 15个JS和3个CSS完全可以通过特殊的办法进行合并(... 阅读全文
posted @ 2009-07-27 09:06 周骏 阅读(416) 评论(1) 推荐(0) 编辑
摘要: --按照月份统计 select count(id) cnt,datepart(mm,time) [Month] from [table] where [time] between '2007/09/08 09:10:43' and '2007/10/09 04:32:37' group by datepart(mm,time) --按照日统计 select count(id) cnt,datepa... 阅读全文
posted @ 2009-07-27 09:01 周骏 阅读(1807) 评论(0) 推荐(0) 编辑