会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
YY哥的技术随笔
——关注Linux、数据库和云计算
博客园
首页
新随笔
联系
订阅
管理
10 2008 档案
Lucene分词初探---LetterTokenizer
摘要:LetterTokenizer的分词算法解析
阅读全文
posted @
2008-10-24 17:58
YY哥
阅读(3495)
评论(6)
推荐(0)
编辑
深入学习Heritrix---解析Frontier(链接工厂)
摘要:Frontier是Heritrix最核心的组成部分之一,也是最复杂的组成部分.它主要功能是为处理链接的线程提供URL,并负责链接处理完成后的一些后续调度操作.并且为了提高效率,它在内部使用了Berkeley DB.本节将对它的内部机理进行详细解剖.
阅读全文
posted @
2008-10-23 19:32
YY哥
阅读(2789)
评论(1)
推荐(1)
编辑
深入学习Heritrix---解析处理器(Processor)
摘要:解析处理器(Processor)
阅读全文
posted @
2008-10-23 12:27
YY哥
阅读(2526)
评论(0)
推荐(0)
编辑
深入学习Heritrix---解析CrawlController
摘要:CrawlController解析
阅读全文
posted @
2008-10-11 23:59
YY哥
阅读(2539)
评论(1)
推荐(0)
编辑
深入学习heritrix---体系结构(Overview of the crawler)
摘要:Heritrix的整体结构分析
阅读全文
posted @
2008-10-11 11:26
YY哥
阅读(3101)
评论(0)
推荐(0)
编辑
线程池及其实现
摘要:线程池及其实现
阅读全文
posted @
2008-10-10 22:47
YY哥
阅读(4458)
评论(4)
推荐(0)
编辑
学工在线新闻搜索引擎0.1 beta版
摘要:学工在线新闻搜索引擎0.1 beta版
阅读全文
posted @
2008-10-10 22:10
YY哥
阅读(566)
评论(0)
推荐(0)
编辑
公告