我要去桂林---田春峰的网志

我要去桂林

导航

2005年11月28日 #

一种面向搜索引擎的网页分块、切片的原理,实现和演示

摘要: 一种面向搜索引擎的网页分块、切片的原理,实现和演示最近看到 2005 年的 全国搜索引擎和网上信息挖掘学术研讨会 上 华南木棉信息检索的队长 欧健文 的 华南木棉信息检索 的ppt。很有启发。于是自己也根据自己的理解准备做一个实现。实现前提假设: 1、网页分块切分的基本单位是html中的table , div 等标签(目前版本只支持:table ,div 标签)。 2、网页分块切片识别依赖于相似u... 阅读全文

posted @ 2005-11-28 10:16 我要去桂林 阅读(1193) 评论(1) 推荐(0) 编辑