最近百度的魏则西事件闹的沸沸扬扬,突然有个想法:是否百度的中文搜索目前还没有人能挑战它的地位呢?
哈哈,想的太多了,正巧毕业设计就和搜索有关,当时只是大致了解了概念:如分词、排序、索引、爬虫等,并以此做了一个基于百度的邮箱抓取工具。
现在看到Lucene这个开源工程,借此研究下。