摘要: 题目解读 1. 文件格式:访问时间,来源IP,响应结果,响应耗时 2. 文件大小:超大规模,TB数量级 解题思路 首先,数据量过大,通过内存计算肯定是不可行的。 考虑采用分治,将大文件切割成小文件,再对小文件分析,找出访问次数最多的,此时将问题转化为:切割小文件算法 具体思路如下: 将1T的文件按照 阅读全文
posted @ 2019-03-18 12:25 ronghantao 阅读(2123) 评论(0) 推荐(0) 编辑
摘要: 关于堆的介绍和操作可以参考:https://www.jianshu.com/p/6b526aa481b1 上面这篇文章写得非常详细。 堆的操作主要有:插入元素、删除堆顶元素两个操作。 以下代码都以小根堆为例。 插入元素代码: 删除堆顶元素代码: 测试代码(创建堆、删除堆顶元素): 输出结果: 阅读全文
posted @ 2019-01-25 12:09 ronghantao 阅读(642) 评论(0) 推荐(0) 编辑
摘要: free的运行结果如下: total used free shared buffers cached Mem: 2097152 1090000 1007152 0 290540 9084008 -/+ buffers/cache: 10021016 123841 Swap: 25151484 224 阅读全文
posted @ 2019-01-24 18:43 ronghantao 阅读(3147) 评论(0) 推荐(0) 编辑
摘要: 一致性Hash算法原理参考此博客,介绍的比较详细:https://www.cnblogs.com/lpfuture/p/5796398.html 预设场景:所有请求过来,会根据一致性hash算法,选择一个服务器转发出去,一致性hash算法获取到的是服务器的ip。 假定节点存储结构如下: 实现方案一( 阅读全文
posted @ 2019-01-24 00:22 ronghantao 阅读(447) 评论(0) 推荐(0) 编辑
摘要: 题干: Given a string, find the length of the longest substring without repeating characters. 给定一个字符串,求他的最长子串。 Example 1: Input: "abcabcbb" Output: 3 Exp 阅读全文
posted @ 2019-01-18 00:19 ronghantao 阅读(128) 评论(0) 推荐(0) 编辑
摘要: 题干: Given a list of daily temperatures T, return a list such that, for each day in the input, tells you how many days you would have to wait until a w 阅读全文
posted @ 2019-01-16 14:41 ronghantao 阅读(936) 评论(0) 推荐(0) 编辑
摘要: 这个问题太简单了,直接上代码 阅读全文
posted @ 2019-01-10 15:32 ronghantao 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 题干: Given a non-negative integer, you could swap two digits at most once to get the maximum valued number. Return the maximum valued number you could 阅读全文
posted @ 2019-01-10 14:26 ronghantao 阅读(916) 评论(0) 推荐(0) 编辑
摘要: 在网上看到某人实现了一个简单的clock,发现代码编译不过,略作修改: 1 package main 2 3 import ( 4 "bufio" 5 "image" 6 "image/color" 7 "image/png" 8 "math" 9 ... 阅读全文
posted @ 2014-06-25 11:38 ronghantao 阅读(559) 评论(0) 推荐(0) 编辑
摘要: 当我们在做折线图、柱状图的时候经常会遇到一个问题:如果横轴元素过多该怎么展示。比如,以时间作为横轴的,如果我们以天为维度统计,那选择一个月,横轴就需要显示30个左右日期,如果选择三个月,就需要显示90个左右日期。一般的做法是限制横轴长度,比如以时间为维度的话,就会限制用户不能超过三个月,但这种做法不是很好,从用户的角度分析,存在两种情况(我们以时间作为横轴):当横轴元素不多时,用户可能会关注每天的数据当横轴元素比较多时(比如用户选择了6个月),用户可能不会关注每天的数据,他的注意力会放到这段时间的趋势上这给我们提供了一个解决方案:当用户选择的时间段过长时,我们可以离散的选择几个来显示自适应算法 阅读全文
posted @ 2013-10-10 19:47 ronghantao 阅读(1648) 评论(0) 推荐(0) 编辑