摘要: Lucene 是一个基于 Java 的全文检索工具包,你可以利用它来为你的应用程序加入索引和检索功能。Lucene 目前是著名的 Apache Jakarta 家族中的一个开源项目,下面我们即将学习 Lucene 的索引机制以及它的索引文件的结构。在这篇文章中,我们首先演示如何使用 Lucene 来索引文档,接着讨论如何提高索引的性能。最后我们来分析 Lucene 的索引文件结构。需要记住的是,L... 阅读全文
posted @ 2008-08-25 16:40 施嘉佳 阅读(1195) 评论(2) 推荐(0) 编辑
摘要: 原贴地址: 已加入Opensymphony的Compass 是对Lucene搜索引擎在企业应用(数据库应用)中的增强。 Lucene本身的API已经非常简单,看看IBM DW上的Beef up Web search apps with Lucene已经大概了解,那Compass还能做什么样的增强呢? 1.在我的项目里,最实际的增强就是Data Mirror功能。 DataMirror会把数据库的... 阅读全文
posted @ 2008-08-25 12:33 施嘉佳 阅读(1289) 评论(0) 推荐(1) 编辑
摘要: lucene学习笔记 阅读全文
posted @ 2008-07-07 14:02 施嘉佳 阅读(620) 评论(0) 推荐(0) 编辑
摘要: 下面简单介绍一下搜索引擎的机器爬虫的制作和一些基本要注意的事项。说的简单易懂一些,网络爬虫跟你使用的〖离线阅读〗工具差不多。说离线,其实还是要跟网络联结,否则怎么抓东西下来?那么不同的地方在哪里?1】 网络爬虫高度可配置性。2】 网络爬虫可以解析抓到的网页里的链接3】 网络爬虫有简单的存储配置4】 网络爬虫拥有智能的根据网页更新分析功能5】 网络爬虫的效率相当的高那么依据特征,其实也就是要求了,如... 阅读全文
posted @ 2008-04-24 15:07 施嘉佳 阅读(768) 评论(0) 推荐(0) 编辑
摘要: 每个使用关系型数据库的程序都可能遇到数据死锁或不可用的情况,而这些情况需要在代码中编程来解决;本文主要介绍与数据库事务死锁等情况相关的重试逻辑概念,此外,还会探讨如何避免死锁等问题,文章以DB2(版本9)与Java为例进行讲解。 什么是数据库锁定与死锁 锁定(Locking)发生在当一个事务获得对某一资源的“锁”时,这时,其他的事务就不能更改这个资源了,这种机制的存在是为了... 阅读全文
posted @ 2008-04-02 16:41 施嘉佳 阅读(538) 评论(0) 推荐(0) 编辑
摘要: Lucene 是基于 Java 的全文信息检索包,它目前是 Apache Jakarta 家族下面的一个开源项目。在这篇文章中,我们首先来看如何利用 Lucene 实现高级搜索功能,然后学习如何利用 Lucene 来创建一个健壮的 Web 搜索应用程序。在本篇文章中,你会学习到如何利用 Lucene 实现高级搜索功能以及如何利用 Lucene 来创建 Web 搜索应用程序。通过这些学习,你就可以利... 阅读全文
posted @ 2008-03-28 10:06 施嘉佳 阅读(700) 评论(1) 推荐(0) 编辑
摘要: 3.1. Lucene核心部分——索引排序 Lucene 的索引排序是使用了倒排序原理。 该结构及相应的生成算法如下: 设有两篇文章1和2 文章1的内容为:Tom lives in Guangzhou,I live in Guangzhou too. 文章2的内容为:He once lived in Shanghai. 1. 由于lucene是基于关键词索引和查询的,首先我们要取得这两篇文章的关键... 阅读全文
posted @ 2008-03-28 09:37 施嘉佳 阅读(1289) 评论(0) 推荐(0) 编辑
摘要: 1lucene简介1.1什么是luceneLucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com或者googleDesktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。1.2lucene能做什么要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,告诉你你要搜索的关键... 阅读全文
posted @ 2008-01-24 13:09 施嘉佳 阅读(9210) 评论(19) 推荐(3) 编辑
摘要: 搜索流程中的第二步就是构建一个Query。下面就来介绍Query及其构建。当用户输入一个关键字,搜索引擎接收到后,并不是立刻就将它放入后台开始进行关键字的检索,而应当首先对这个关键字进行一定的分析和处理,使之成为一种后台可以理解的形式,只有这样,才能提高检索的效率,同时检索出更加有效的结果。那么,在Lucene中,这种处理,其实就是构建一个Query对象。就Query对象本身言,它只是Lucene... 阅读全文
posted @ 2008-01-24 11:59 施嘉佳 阅读(5352) 评论(2) 推荐(0) 编辑
摘要: 在我的文件下有AJAX开发简略.rar跟ajaxdemo.rar,大家有兴趣的话可以下载 AJAX开发简略.rar:是电子书. ajaxdemo.rar:是我写的一个Demo. 阅读全文
posted @ 2006-09-08 13:37 施嘉佳 阅读(495) 评论(3) 推荐(0) 编辑