2012年9月26日

【转】求解平面最近点对的问题

摘要: 美团面试,出了一道题,只想到暴力解法,分治硬是没想出来。。。。FROM:http://www.cnblogs.com/xdruid/archive/2012/05/27/CP.html(好吧。。。第一篇blog,之前没有写的习惯,现在还是开始慢慢记录下来吧~) 所谓最近点对呢,就是平面上给你一堆点,然后求出这堆点中相距最小的距离。 假如数据量比较小的话,那肯定是枚举所有点对求出各自距离再比较更方便了。很明显,枚举的时间复杂度是O(n²)。不过一般不会给你这样的问题,点的个数往往很多,那就必然不能用枚举了。 这里要使用一种O(nlog(n))的算法。 这个算法主要思想就是分治, 算法描 阅读全文

posted @ 2012-09-26 16:12 风程 阅读(1971) 评论(0) 推荐(0) 编辑

2012年9月20日

2012年9月亚马逊在线笔试题

摘要: 前几天我有幸收到亚马逊在线笔试邀请,于是今天上午准时参加了笔试。共2道算法编程题,由于是第一次参加这种笔试,即便是在线,由于时间限制,难免会紧张。总共限时为2.5h,完成第一道题就花了2h,第2道题因此也没有完成了,遗憾+惭愧!下面给出第一道题的解答。题目如下:Question:Given an array with positive integers and another integer for example{7 2 4} 9, you are required to generate an equation, by inserting operator add ("+&quo 阅读全文

posted @ 2012-09-20 16:10 风程 阅读(7214) 评论(11) 推荐(0) 编辑

2012年9月13日

【转】kmp算法的理解与实现

摘要: 文章来源:http://kenby.iteye.com/blog/1025599KMP算法曾被我戏称为看毛片算法,当时笑喷......大三那个时候硬着头皮把算法导论的kmp算法啃完,弄懂了kmp算法 的原理,甚至还写出了代码,这几天再次温习的时候,发现忘得比较彻底。我总结,学算法不能只对着书本学理论,而应该用自己的理解去看清算法的本质,最好用文字把你的理解记录下来,这样才能做到活学活用,而且不容易忘。写这篇博客就是想把自己这几天的思路记下来。一 kmp算法为什么比传统的字符串匹配算法快假设文本T = y1y2y3....yn, 模式 P = p1p2p3...pm, 传统的匹配算法把位移为0, 阅读全文

posted @ 2012-09-13 20:12 风程 阅读(374) 评论(0) 推荐(0) 编辑

2012年9月1日

推荐系统入门实践:世纪佳缘会员推荐(完整版)

摘要: 版本作者联系日期1.0周巍然weiran.chow@gmail.com201207232.0严 程supersteven198701@gmail.com201208213.0严 程supersteven198701@gmail.com20120831摘要: 本文以2011年举办的第一届数据挖掘邀请赛的"世纪佳缘会员推荐"赛题为例,尝试了5种排序方法来为新注册会员推荐容易受到亲睐的老会员。 先看5种排序方法的测试结果,以便朋友们有针对性地浏览本文。 基于5倍交叉验证 NDCG@10基于training set验证 NDCG@10随机模型0.08659561709415893基 阅读全文

posted @ 2012-09-01 13:58 风程 阅读(15453) 评论(21) 推荐(20) 编辑

2012年8月30日

【转|译】Reddit 评级算法的工作原理

摘要: 本文为"How Reddit ranking algorithms work”的译文,可对照参考原文译者: Tiezhen WANG这篇是 Hacker News 评级算法的工作原理 一文的姊妹篇。这回主要讲的是 Reddit 是如何对话题和回复进行排序的。Reddit 的评级算法本身是非常容易理解和实现的,这里我想做深入一些的探讨。第一部分主要是对话题排名的讨论,比如 Reddit 是如何对话题进行排名的。接下来是评论排名的讨论,Reddit 对话题和评论使用了不同的评级算法 (这一点跟 Hacker News 不太一样), Reddit 的评论排名算法是很值得玩味的,它由 Ran 阅读全文

posted @ 2012-08-30 21:18 风程 阅读(779) 评论(0) 推荐(0) 编辑

【转】Reddit 评论排名算法

摘要: 这篇文章介绍了Reddit的排名算法,今天继续上一篇文章,需要学习的是Reddit的评论排名算法。与文章新闻类排名不同的是,评论类的算法可能发表时间没有什么关系。 目前很多网站采用的评论排名主要有两种,即绝对好评数(好评减去差评)和好评率(好评/总评)。这两种评价方式 都存在很明显的缺陷,以下为事例:●A:好评550; 差评450●B:好评60;差评40●C:好评1;差评0●D:好评9,差评1 首先是A与B比较,A的绝对好评数是550-450=100,B的绝对好评数是60-40=20,从绝对好评数比较,A的排名应该在B的前面;A的好评率为550/(450+550)=55%,B的好评率为60/. 阅读全文

posted @ 2012-08-30 20:49 风程 阅读(397) 评论(0) 推荐(0) 编辑

【转】基于用户投票的排名算法

摘要: 本文所有权归 阮一峰 老师所有!目录 基于用户投票的排名算法(一):Delicious和Hacker News 基于用户投票的排名算法(二):Reddit 基于用户投票的排名算法(三):Stack Overflow 基于用户投票的排名算法(四):牛顿冷却定律 基于用户投票的排名算法(五):威尔逊区间 基于用户投票的排名算法(六):贝叶斯平均 基于用户投票的排名算法(一):Delicious和Hacker News 互联网的出现,意味着"信息大爆炸"。 用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。 各种. 阅读全文

posted @ 2012-08-30 20:27 风程 阅读(349) 评论(0) 推荐(0) 编辑

2012年8月29日

推荐系统入门实践:世纪佳缘会员推荐

摘要: 版本作者联系日期1.0周巍然weiran.chow@gmail.com201207232.0严 程supersteven198701@gmail.com20120821前言 背景:Amazon的数百万图书,Netflix的10万部电影,淘宝的8亿件在线商品,以及数以亿万计用户的资料和行为记录……互联网公司最近十年的迅猛发展伴随着海量数据的积累。然而,在线用户常常面对过多的选择而显得无所适从。心理学研究证实这类情境下的用户有时做出放弃交易的决定,从而造成大量潜在的用户流失。统计技术的发展能够为在线服务商提供更有效的推荐算法,在帮助用户走出信息过载困境、改善用户体验的同时,还能够挖掘商品长尾、提. 阅读全文

posted @ 2012-08-29 14:43 风程 阅读(1243) 评论(0) 推荐(0) 编辑

2009年9月26日

【转】多线程学习笔记

摘要: 多线程概述  进程和线程都是操作系统的概念。进程是应用程序的执行实例,每个进程是由私有的虚拟地址空间、代码、数据和其它各种系统资源组成,进程在运行过程中创建的资源随着进程的终止而被销毁,所使用的系统资源在进程终止时被释放或关闭。  线程是进程内部的一个执行单元。系统创建好进程后,实际上就启动执行了该进程的主执行线程,主执行线程以函数地址形式,比如说main或WinMain函数,将程序的启动点提供给... 阅读全文

posted @ 2009-09-26 18:34 风程 阅读(445) 评论(0) 推荐(0) 编辑

2009年9月7日

一个程序员的奋斗历程

摘要: http://www.iteer.net/modules/doc/article.php?storyid=724&page=0 阅读全文

posted @ 2009-09-07 09:34 风程 阅读(317) 评论(0) 推荐(0) 编辑

导航