上一页 1 2 3 4 5 6 ··· 21 下一页
摘要: 1. 背景 互联网网页是通用搜索引擎主要的处理对象,目前互联网上的网页数量以百亿计,所以通用搜索引擎首要面临的问题是:如何设计出高效的下载系统,将海量的网页数据传输到本地,在本地形成互联网网页的镜像备份。这就是网络爬虫的功能。 2. 通用爬虫框架 下图是一个通用的爬虫框架 首先取一部分高质量的网页, 阅读全文
posted @ 2022-11-27 20:06 Hugh_Locke 阅读(316) 评论(0) 推荐(0) 编辑
摘要: 0. 前言 本系列文章主要是源于对《搜索引擎的技术架构》一书的读书笔记,其中会掺杂在其他文章或书籍的内容以及我个人对搜索引擎的理解,阅读顺序也没有按照书中目录的顺序来,相比于单纯的知识点总结,本系列更像是我借由此书来谈一谈我对搜索引擎的理解。 本系列文章专注于描述搜索引擎的技术架构,对搜索引擎的历史 阅读全文
posted @ 2022-11-27 20:04 Hugh_Locke 阅读(479) 评论(0) 推荐(0) 编辑
摘要: 1. 背景 编码指的是内存里的整数和字符串放到磁盘上的方式,其主要目的有两个 对不定长整数以及字符串能够在读取的时候感知到已经读取完了整个值 最大程度的节省在磁盘上占用的空间 2. 设计 2.1 整数 整数的种类上分为定长整数和不定长整数,而定长整数又分为32位整数和64位整数。 整数在存储方式上可 阅读全文
posted @ 2022-11-27 01:44 Hugh_Locke 阅读(133) 评论(0) 推荐(0) 编辑
摘要: 1. 背景 对于数据库来说,内存的分配非常重要,当我们使用C++默认的内存分配方式 malloc/free或者new/delete的时候,如果遇到很小的键值对时,每次调用的平均开销就会比较大,同时会产生很多内存碎片。 由于在MemTable中经常会遇到需要为较小键值对分配内存的原因,LevelDB在 阅读全文
posted @ 2022-11-27 01:43 Hugh_Locke 阅读(326) 评论(0) 推荐(0) 编辑
摘要: 1. 介绍 1.1 描述 LSM Tree(Log Structured merge Tree) 意思是日志结构合并树。目前广泛应用于一些流行的KV存储引擎中(LevelDBl、HBase、Bigtable等) LSM树并不是像红黑树,B树那样树严格的树状结构,而是一种存储结构 其中日志结构指的是用 阅读全文
posted @ 2022-11-27 01:42 Hugh_Locke 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 1. 介绍 1.1 描述 SSTable(Sorted String Table)是一个通常放在磁盘上的,排序的字符串表, 用来高效存储大量的键值对数据, 同时搭配上优化实现IO操作的高吞吐量. 1.2 背景 当我们要运行一系列的Map-Reduce任务时,因为输入的数据量很大,所以消耗在IO的时间 阅读全文
posted @ 2022-11-27 01:39 Hugh_Locke 阅读(1178) 评论(0) 推荐(0) 编辑
摘要: 题意 给你一个由n个元素和k≤n的整数组成的数组a。 您要在数组a中获得至少k个相等的元素。一次移动,可以执行以下两个操作之一: 取数组的最小元素之一,并将其值增加1 取数组的最大元素之一,并将其值减少1 您的任务是计算在数组中至少获得k个相等元素所需的最小移动次数。 Input 输入的第一行包含两 阅读全文
posted @ 2020-10-03 16:32 Hugh_Locke 阅读(198) 评论(0) 推荐(1) 编辑
摘要: 题意 给出一个有n个顶点的有根树,顶点的编号从1到n。树的根节点编号恒为1。 一棵数是具有n-1条边的联通图。 给出 m 个询问。第i个询问由 k_i 个不同的节点 v_i[1], v_i[2], …, v_i[k_i]组成. 你的任务是判断是否存在一条从根节点到u的路径,使得给出的k_i个节点要么 阅读全文
posted @ 2020-10-03 15:42 Hugh_Locke 阅读(193) 评论(0) 推荐(1) 编辑
摘要: 题意 伊珂丝是个爱玩游戏的少女。经常因为贪玩而耽误了咖啡馆的工作,也因此常被店长吐槽。不过真到了干活的时候,伊珂丝也是当仁不让的! 这次伊珂丝又来找店长PK了,如果店长赢下这局,伊珂丝就答应在咖啡馆里干一天活儿,你能帮帮店长,战胜伊珂丝吗? 游戏规则如下: 游戏中一开始有n个数字排成一排,这n(<= 阅读全文
posted @ 2020-10-03 15:05 Hugh_Locke 阅读(131) 评论(0) 推荐(0) 编辑
摘要: 题意 找出满足下列条件的数组个数: 包含 n 个元素 每个元素的数值范围在 1 到 m 之间 数组中恰好只有一对元素的数值相等 数组中存在一个下标 i 满足在 i 之前数组是严格递增的,而在 i 之后数组是严格递减的 (若 j < i 则 aj < aj + 1,若 j ≥ i 则 aj > aj 阅读全文
posted @ 2020-10-02 20:06 Hugh_Locke 阅读(113) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 21 下一页