摘要: 第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再详细介绍下此方案:首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法,比如模1000,把整个大文件映射为1000个小文件,再找出每个小文中出现频率最大的IP(可以采用hash_map进行频率统计,然后再找出频率最大的几个)及相应的频率。然后再在这1000个 阅读全文
posted @ 2011-06-05 19:32 Bruce-He 阅读(212) 评论(0) 推荐(0) 编辑
摘要: jQuery是继prototype之后又一个优秀的JavaScrīpt框架。 近期国外科技网站W3Techs公布了黑客对近100万个网站进行的调查报告分析显示:“jQuery是目前最流行的JavaScript库”。【51CTO独家特稿】近期国外科技网站W3Techs公布了黑客对近100万个网站进行调查分析报告显示:“jQuery是目前最流行的JavaScript库”。W3Techs发现被调查的网站中有61.0%的网站没有使用任何的JavaScript库,而使用jQuery的占到总数的29.2%,而使用MooTools、Prototyp、ASP.NET Ajax、Dojo等其他JavaScrip 阅读全文
posted @ 2011-06-05 14:38 Bruce-He 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 以下我给你列出常见的状态码200 OK指示客服端的请求已经成功收到,解析,接受。201 Created请求已经完成并一个新的返回资源被创建。被创建的资源可能是一个URI资源,通常URI资源在Location头指定。回送应该包含一个实体数据并且包含资源特性以及location通过用户或者用户代理来选择合适的方法。实体数据格式通过煤体类型来指定即content-type头。最开始服务器必须创建指定的资源在返回201状态码之前。如果行为没有被立刻执行,服务器应该返回202。202 Accepted请求已经被接受用来处理。但是处理并没有完成。请求可能或者根本没有遵照执行,因为处理实际执行过程中可能被拒 阅读全文
posted @ 2011-06-05 14:31 Bruce-He 阅读(261) 评论(0) 推荐(0) 编辑
摘要: MSSQL为我们提供了两种动态执行SQL语句的命令,分别是EXEC和sp_executesql;通常,sp_executesql则更具有优势,它提供了输入输出接口,而EXEC没有。还有一个最大的好处就是利用sp_executesql,能够重用执行计划,这就大大提供了执行性能,还可以编写更安全的代码。EXEC在某些情况下会更灵活。除非您有令人信服的理由使用EXEC,否侧尽量使用sp_executesql.1.EXEC的使用 EXEC命令有两种用法,一种是执行一个存储过程,另一种是执行一个动态的批处理。以下所讲的都是第二种用法。 下面先使用EXEC演示一个例子,代码1代码 DECLARE @Ta. 阅读全文
posted @ 2011-06-05 13:07 Bruce-He 阅读(412) 评论(0) 推荐(2) 编辑
成都共享办公室