Lucene的多线程访问原则和同步,锁机制

本文介绍lucene多线程环境下的使用原则和commit.lock与write.lock实现的锁机制。

设计之初就是服务于多线程环境，大多数情况下索引会被不至一个线程访问。索引时一个关键资源。在对这样的资源进行访问时，不可避免地会出现同步访问的问题。因此需要有很好的策略来处理这些并发访问，以保证资源的合理使用。对索引的非法访问可能导致索引数据异常，进而毁坏重要的数据，导致整个系统的失败。

下面是索引访问的原则：

1.在同一时刻，lucene索引中允许有一个进程对其进行加入文档，删除文档，更新索引等操作。

2.在同一时刻，lucene索引允许多个线程同时对其进行检索。

在Lucene中，对索引发生修改的类主要集中在IndexWriter和IndexReader。其中，IndexWriter主要负责对索引的写入和索引的整体的维护，如合并，优化等操作；IndexReader则负责从索引中删除文档。

如果按照上面第一句所说，则可以得出以下结论：

1.任一时刻，在系统中只能有一个IndexWriter的实例对索引进行操作，不允许有多个IndexWriter向索引添加Document,或是优化索引，合并索引。

2.任一时刻，不能有多个IndexReader在执行文档的删除操作。下一个InderReader应当在上一个InderReader执行close方法之后运行。

3.在使用IndexWriter向索引加入文档前，必须先关闭执行删除操作的IndexReader实例。

4.在使用IndexReader删除前，必须先关闭执行添加Document操作IndexWriter的实例。

综合说来，任何对索引发生修改的操作都不能同时发生；或是在上一修改操作未保存的情况下，用新的实例对索引进行下一修改操作。

Lucene锁机制

lucene使用commit.lock

与write.lock实现锁机制。所谓的锁其实是存放于系统临时目录内的一个文件。例如，建立索引时，可以看到一个write.lock存放在临时目录中。又如，当合并索引时，会看到一个commit.lock存放在临时目录中。

那么，这些锁究竟在什么时候会出现呢？正如前面所说到的，Lucene的同步问题只可能发生在对索引进行文档添加，文档删除，合并segment和优化时，因此lucene锁也基本都出现在这时候。

1.write.lock

writer.lock出现在向索引添加文档时，或是将文档从索引中删除时。writer.lock会在indexwriter被初始化时创建，然后会在调用IndexWriter的close()方法时被释放。另外，会在IndexReader使用delete方法删除文档时创建，并在调用 IndexReader的close()方法时被释放。

2.commit.lock

commit.lock主要与segment合并和读取的操作相关。例如，他出现在IndexWriter的初始化时，但是一旦当segment的信息被读取完毕，它就会立刻被释放。另外，当调用IndexWriter的AddIndexs()或MergeSegment()方法时，都会生成这个锁。

事实上，由于有了这两个锁的所有，才使得lucene具有了保护器索引不受非法操作的功能。

建议IndexWriter作为单例模式得到，IndexReader进行删除时上锁

posted @ 2014-04-14 16:24 Sonet 阅读(490) 评论(0) 编辑收藏举报

刷新页面返回顶部

Sonet

站在巨人的肩膀上--mykey

Lucene的多线程访问原则和同步,锁机制

Lucene锁机制

1.write.lock

2.commit.lock

公告