2013 年 8月 19 日随笔档案 - wmx3ng

2013年8月19日

摘要： FROM:http://ac.jobdu.com/problem.php?pid=1530题目描述：最长不重复子串就是从一个字符串中找到一个连续子串，该子串中任何两个字符都不能相同，且该子串的长度是最大的。输入：输入包含多个测试用例，每组测试用例输入一行由小写英文字符a,b,c...x,y,z组成的字符串，字符串的长度不大于10000。输出：对于每组测试用例，输出最大长度的不重复子串长度。样例输入：absdabbaabdffd样例输出：424来源：阿尔卡特2013年实习生招聘笔试题 1 #include 2 #include 3 int main() 4 { 5 char arr[10... 阅读全文

posted @ 2013-08-19 22:14 wmx3ng 阅读(382) 评论(0) 推荐(0) 编辑

为集群配置Impala和Mapreduce

摘要： FROM:http://www.importnew.com/5881.html-- 扫描加关注，微信号: importnew --原文链接：Cloudera翻译：ImportNew.com-Royce Wong译文链接：http://www.importnew.com/5881.htmlCloudera Impala包含很多令人惊喜的特性，但是其给人印象最深的应该是支持以多种格式分析HDFS和HBase中数据的能力，并且不需要ETL。此外，用户可以使用多个框架如mapreduce和impala来分析相同的数据。因此，Impala可以和mapreduce一起运行在相同的物理机器上，支持企业的关键阅读全文

posted @ 2013-08-19 16:50 wmx3ng 阅读(764) 评论(0) 推荐(0) 编辑

海量数据面试题举例

摘要： FROM:http://blogread.cn/it/article/2455?f=wb大数据量的问题是很多面试笔试中经常出现的问题，比如baidu google 腾讯这样的一些涉及到海量数据的公司经常会问到。下面的方法是我对海量数据的处理方法进行了一个一般性的总结，当然这些方法可能并不能完全覆盖所有的问题，但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目，方法不一定最优，如果你有更好的处理方法，欢迎与我讨论。1.Bloom filter适用范围：可以用来实现数据字典，进行数据的判重，或者集合求交集基本原理及要点：对于原理来说很简单，位数组阅读全文

posted @ 2013-08-19 16:48 wmx3ng 阅读(292) 评论(0) 推荐(0) 编辑

wmx3ng

公告