上一页 1 ··· 491 492 493 494 495 496 497 498 499 ··· 549 下一页
摘要: 第十五章 爬取维基百科 原文:Chapter 15 Crawling Wikipedia 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在本章中,我展示了上一个练习的解决方案,并分析了 Web 索引算法的性能。然后我们构建一个简单的 Web 爬虫。 15.1 基于 Redis 阅读全文
posted @ 2017-09-23 22:07 绝不原创的飞龙 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 第十四章 持久化 原文:Chapter 14 Persistence 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在接下来的几个练习中,我们将返回到网页搜索引擎的构建。为了回顾,搜索引擎的组件是: 抓取:我们需要一个程序,可以下载一个网页,解析它,并提取文本和任何其他页面的 阅读全文
posted @ 2017-09-23 22:01 绝不原创的飞龙 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 第十三章 二叉搜索树 原文:Chapter 13 Binary search tree 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章介绍了上一个练习的解决方案,然后测试树形映射的性能。我展示了一个实现的问题,并解释了 Java 的TreeMap如何解决它。 13.1 简 阅读全文
posted @ 2017-09-22 23:20 绝不原创的飞龙 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 第十二章 TreeMap 原文:Chapter 12 TreeMap 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 这一章展示了二叉搜索树,它是个Map接口的高效实现。如果我们想让元素有序,它非常实用。 12.1 哈希哪里不对? 此时,你应该熟悉 Java 提供的Map接口和 阅读全文
posted @ 2017-09-22 23:11 绝不原创的飞龙 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 第十一章 HashMap 原文:Chapter 11 HashMap 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 上一章中,我们写了一个使用哈希的Map接口的实现。我们期望这个版本更快,因为它搜索的列表较短,但增长顺序仍然是线性的。 如果存在n个条目和k个子映射,则子映射的 阅读全文
posted @ 2017-09-21 17:52 绝不原创的飞龙 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 第十章 哈希 原文:Chapter 10 Hashing 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在本章中,我定义了一个比MyLinearMap更好的Map接口实现,MyBetterMap,并引入哈希,这使得MyBetterMap效率更高。 10.1 哈希 为了提高My 阅读全文
posted @ 2017-09-20 15:35 绝不原创的飞龙 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 第九章 Map接口 原文:Chapter 9 The Map interface 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 在接下来的几个练习中,我介绍了Map接口的几个实现。其中一个基于哈希表,这可以说是所发明的最神奇的数据结构。另一个是类似的TreeMap,不是很神奇 阅读全文
posted @ 2017-09-20 11:58 绝不原创的飞龙 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 第八章 索引器 原文:Chapter 8 Indexer 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 目前,我们构建了一个基本的 Web 爬虫;我们下一步将是索引。在网页搜索的上下文中,索引是一种数据结构,可以查找检索词并找到该词出现的页面。此外,我们想知道每个页面上显示检 阅读全文
posted @ 2017-09-12 19:37 绝不原创的飞龙 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 第七章 到达哲学 原文:Chapter 7 Getting to Philosophy 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章的目标是开发一个 Web 爬虫,它测试了第 6.1 节中提到的“到达哲学”猜想。 7.1 起步 在本书的仓库中,你将找到一些帮助你起步的代 阅读全文
posted @ 2017-09-07 11:55 绝不原创的飞龙 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 第六章 树的遍历 原文:Chapter 6 Tree traversal 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 本章将介绍一个 Web 搜索引擎,我们将在本书其余部分开发它。我描述了搜索引擎的元素,并介绍了第一个应用程序,一个从维基百科下载和解析页面的 Web 爬行器 阅读全文
posted @ 2017-09-04 15:12 绝不原创的飞龙 阅读(11) 评论(0) 推荐(0) 编辑
上一页 1 ··· 491 492 493 494 495 496 497 498 499 ··· 549 下一页