摘要: 1.通用搜索引擎面临着索引规模、更新速度、个性化需求等多方面挑战 2.如果网页 p 中包含超链接 l, 则 p 称为链接 l 的父网页;如果超链接 l 指向网页 t, 则网页 t 称为子网页,又称为目标网页。 3.主题网络爬虫的基本思路就是按照事先给出的主题, 分析超链接和已经下载的网页内容, 预测 阅读全文
posted @ 2016-09-23 22:10 东南亚 阅读(114) 评论(0) 推荐(0) 编辑