摘要: FROM:http://ac.jobdu.com/problem.php?pid=1530题目描述:最长不重复子串就是从一个字符串中找到一个连续子串,该子串中任何两个字符都不能相同,且该子串的长度是最大的。输入:输入包含多个测试用例,每组测试用例输入一行由小写英文字符a,b,c...x,y,z组成的字符串,字符串的长度不大于10000。输出:对于每组测试用例,输出最大长度的不重复子串长度。样例输入:absdabbaabdffd样例输出:424来源:阿尔卡特2013年实习生招聘笔试题 1 #include 2 #include 3 int main() 4 { 5 char arr[10... 阅读全文
posted @ 2013-08-19 22:14 wmx3ng 阅读(373) 评论(0) 推荐(0) 编辑
摘要: FROM:http://www.importnew.com/5881.html-- 扫描加关注,微信号: importnew --原文链接:Cloudera翻译:ImportNew.com-Royce Wong译文链接:http://www.importnew.com/5881.htmlCloudera Impala包含很多令人惊喜的特性,但是其给人印象最深的应该是支持以多种格式分析HDFS和HBase中数据的能力,并且不需要ETL。此外,用户可以使用多个框架如mapreduce和impala来分析相同的数据。因此,Impala可以和mapreduce一起运行在相同的物理机器上,支持企业的关键 阅读全文
posted @ 2013-08-19 16:50 wmx3ng 阅读(762) 评论(0) 推荐(0) 编辑
摘要: FROM:http://blogread.cn/it/article/2455?f=wb大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对 于原理来说很简单,位数组 阅读全文
posted @ 2013-08-19 16:48 wmx3ng 阅读(285) 评论(0) 推荐(0) 编辑