2012 年 9月 23 日随笔档案 - 积淀

2012年9月23日

摘要：九月腾讯，创新工场，淘宝等公司最新面试三十题引言曾记否，去年的10月份也同此刻一样，是找工作的高峰期，本博客便是最初由整理微软等公司面试题而发展而来的。如今，又即将迈入求职高峰期--10月份，而本人也正在找工作中，所以，也不免关注了网上和我个人建的算法群Algorithms1-12群内朋友发布和讨论的最新面试题。特此整理，以飨诸位。至于答案，望诸位共同讨论与思考。最新面试十三题好久没有好好享受思考了。ok，任何人有任何意见或问题，欢迎不吝指导：1五只猴子分桃。半夜，第一只猴子先起来，它把桃分成了相等的五堆，多出一只。于是，它吃掉了一个，拿走了一堆；第二只猴子起来一看，只有四堆桃。于是把四堆合在阅读全文

posted @ 2012-09-23 08:31 积淀阅读(628) 评论(0) 推荐(0) 编辑

海量数据处理：十道面试题与十个海量数据处理方法总结

摘要：海量数据处理：十道面试题与十个海量数据处理方法总结作者：July、youwang、yanxionglu。时间：二零一一年三月二十六日说明：本文分为俩部分，第一部分为10道海量数据处理的面试题，第二部分为10个海量数据处理的方法总结。有任何问题，欢迎交流、指正。出处：http://blog.csdn.net/v_JULY_v。------------------------------------------第一部分、十道海量数据处理面试题1、海量日志数据，提取出某日访问百度次数最多的那个IP。首先是这一天，并且是访问百度的日志中的IP取出来，逐个写入到一个大文件中。注意到IP是32位的，最多有阅读全文

posted @ 2012-09-23 08:30 积淀阅读(393) 评论(0) 推荐(0) 编辑

何谓海量数据处理？

摘要：所谓海量数据处理，无非就是基于海量数据上的存储、处理、操作。何谓海量，就是数据量太大，所以导致要么是无法在较短时间内迅速解决，要么是数据太大，导致无法一次性装入内存。那解决办法呢?针对时间，我们可以采用巧妙的算法搭配合适的数据结构，如Bloomfilter/Hash/bit-map/堆/数据库或倒排索引/trie树，针对空间，无非就一个办法：大而化小：分而治之/hash映射，你不是说规模太大嘛，那简单啊，就把规模大化为规模小的，各个击破不就完了嘛。至于所谓的单机及集群问题，通俗点来讲，单机就是处理装载数据的机器有限(只要考虑cpu，内存，硬盘的数据交互)，而集群，机器有多辆，适合分布式处理，并阅读全文

posted @ 2012-09-23 08:29 积淀阅读(1358) 评论(0) 推荐(1) 编辑

二维数组中的查找

摘要：在一个二维数组中，每一行都按照从左到右递增的顺序排序，每一列都按照从上到下递增的顺序排序。请完成一个函数，输入这样的一个二维数组和一个整数，判断数组中是否含有该整数。例如下面的二维数组就是每行、每列都递增排序。如果在这个数组中查找数字7，则返回true；如果查找数字5，由于数组不含有该数字，则返回false。我的解题思路是这样的矩阵行列都是从小到大排好序的，要查找的话自然用二分效率比较高，而且这样的矩阵有个性质，最左上角的元素必定是最小值，最右下角的是最大值，在一个n*n的矩阵中，对角线的元素也是排好序的，找到对角线上的一个元素，使得这个元素小于待查找的key，并且下一元素大于待查找的key，阅读全文

posted @ 2012-09-23 00:45 积淀阅读(773) 评论(0) 推荐(0) 编辑

积淀

一点一滴的积累，一点一滴的沉淀！

公告