摘要: 1、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 1) 可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。 2) 遍历文件a,对每个url求取 , 阅读全文
posted @ 2017-10-21 21:53 老冯谈BigData 阅读(10487) 评论(0) 推荐(0) 编辑
摘要: 一、基础题 1.请写出http和https请求的区别,并写出遇到过的响应状态码. 一、https协议需要到ca申请证书,一般免费证书很少,需要交费。 二、http是超文本传输协议,信息是明文传输,https 则是具有安全性的ssl加密传输协议。 三、http和https使用的是完全不同的连接方式,用 阅读全文
posted @ 2017-10-21 16:18 老冯谈BigData 阅读(20472) 评论(1) 推荐(2) 编辑