摘要: 看完之后,终于明白为什么优秀的工程师都去了/想去facebook,因为那里是工程师们的天堂。我对facebook的运转着迷。这是一个很独特的环境,不容易被复制(他们的体系并不适合所有的公司,即使他们努力尝试过)。下面是我和facebook的朋友们关于他们如何开发和管理项目的记录。现在距离我收集的这些信息又过去6个月了,我相信facebook肯定又对他们的项目开发实践进行了改进。所以这些记录可能会有点过时。同时facebook的工程师驱动文化也越来越为大众所知。非常感谢那些帮助我整理这篇文章的facebook的朋友们。记录:截止到2010年6月,facebook有将近2000名员工,10个月前只 阅读全文
posted @ 2012-03-17 12:10 星语心愿~ 阅读(208) 评论(0) 推荐(0) 编辑
摘要: 填补计算机和人类智慧之间的鸿沟——数据智慧工程师目前关于使用数据提升各种系统性能的职位有很多,比如商业智能分析师,个性化推荐工程师等等。我认为可以统称为数据智慧工程师。因为他们的工作性质几乎相同:数据来源:采集的原始数据,比如服务器log,围脖言论,传感器记录,股票交易记录等;目标知识:获取有价值的知识——需要、易于理解、可靠。用途:使用这些知识,获得更大价值——(个性化推荐,卖出更多商品)、(正确股票交易,挣更多钱)、(规避危机)。难点:人类有智能:让数据有智能是目标。比如积累了数据就了解了社会发展趋势、用户兴趣。计算机无智能:他只知道运算,迭代收敛,条件判读,规则推理已经是其最高智慧了。如 阅读全文
posted @ 2012-03-17 12:01 星语心愿~ 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 越来越觉得,人生的成败与否完全决定于是否能够战胜一个人——自己:1、自己的惰性;2、自己的虚幻;3、任何事情不要拖拉;4、专注,把事情做到极致;5、持之以恒! 阅读全文
posted @ 2012-03-17 11:59 星语心愿~ 阅读(164) 评论(0) 推荐(0) 编辑
摘要: 题目:Friendship and Mobility: User Movement inLocation-Based Social Networks来源:SIGKDD-2011(数据挖掘顶级会议)作者单位:斯坦福大学(Eunjoon Cho,Seth A. Myers,Jure Leskovec)译者:雨梦:http://weibo.com/yumengkk,个人主页:www.upcom.tk原文:google 学术进行搜索摘要: 尽管人类的活动具有很高的自由度,但是仍旧受到地理空间和社会关系的限制。通过研究来自两个位置社交网络中用户的位置数据,我们试图为用户的活动建模,探索其固有的规律... 阅读全文
posted @ 2012-03-17 11:58 星语心愿~ 阅读(396) 评论(0) 推荐(0) 编辑
摘要: Don’t Become a Scientist!Jonathan I. KatzProfessor of PhysicsWashington University, St. Louis, Mo.[my last name]@wuphys.wustl.edu千万别成为科学家!约拿单 I. 卡茨,物理学教授,华盛顿大学Are you thinking of becoming a scientist? Do you want to uncover the mysteries of nature, perform experiments or carry out calculations to le 阅读全文
posted @ 2012-03-17 11:56 星语心愿~ 阅读(714) 评论(0) 推荐(0) 编辑
摘要: 新兴研究领域介绍:图挖掘和多关系数据挖掘。一、什么是图挖掘?为什么进行图挖掘 1、图的用途越来越广,包括对互联网、社会化网络、生物、电路、图像的建模。 2、许多图搜索算法已经被开发出来了,并且广泛用在信息检索、计算机视觉等领域; 3、需要进一步开发高效的图挖掘算法,以便从更加复杂的结构化数据中挖掘出有效的知识。二、挖掘频繁子图 1、Apriori-based 方法:包括AGM,FSG和path-join算法; 2、Pattern growth graphy method;三、社会网络应用的连接分析(link analysis) 1、基于连接的对象分类(Link bas... 阅读全文
posted @ 2012-03-17 11:54 星语心愿~ 阅读(558) 评论(0) 推荐(0) 编辑
摘要: 两小时足够完成一个创意并实现他了,花费四周的设计只不过是在添油加醋的虚伪工作。成功的人并不是一定比别人更有才智和更幸运。他们只是在不断的尝试、不断的失败,直到成功。在两个小时内考虑好自己要干什么,而后两小时内实现他。不停的实践,纠错,直到成功。 阅读全文
posted @ 2012-03-17 11:53 星语心愿~ 阅读(122) 评论(0) 推荐(0) 编辑
摘要: 每次谈到数据挖掘都让人很兴奋,但是真正的应用有几个是数据挖掘算法支撑起来的呢:大家哈哈一笑,”除了尿布和啤酒“还有什么拿的出的例子吗。传统的统计学方法可以解决大多数知识发现问题。数据挖掘实际上是一组在人类高级智能和计算机低级智能间的抽象算法:分类(聚类,智能是基础)、关联(和专家系统的规则有区别吗)。个人认为数据挖掘的几个算法其本质类似于数据库领域的”SQL“语句。用几个基本的算子尽量组织成复杂的逻辑,解决现实的问题。说了半天,数据挖掘的发展不外乎两个方向:1、扩展到更多领域,用基本的方法解决新问题;2、优化算法(设计新的算法)更快的完成几个功能(包括解决大数据问题需要的方法)。 因此,... 阅读全文
posted @ 2012-03-17 11:53 星语心愿~ 阅读(251) 评论(0) 推荐(0) 编辑
摘要: Predict which users (or information sources) oneuser might follow in Tencent Weibo.数据挖掘竞赛主题一:预测围脖的潜在关注者(腾讯赞助)竞赛主页:http://www.kddcup2012.org/c/kddcup2012-track11、背景 近些年,在线社交网络发展的如火如荼,流行的站点有twitter,facebook等。在2010年4月发布以来,腾讯微博每天都有成千上万的人加入。腾讯微博作为中国最大的围脖系统之一,已经成为了人们发掘朋友共享爱好的平台。当前该平台已经拥有2亿用户,每天产生月四千万信息。这些 阅读全文
posted @ 2012-03-17 11:51 星语心愿~ 阅读(731) 评论(0) 推荐(0) 编辑
摘要: Kaggle is an innovative solution for statistical/analytics outsourcing. We are the leading platform for predictive modeling competitions. Companies, governments and researchers present datasets and problems – the world’s best data scientists then compete to produce the best solutions. At the end of 阅读全文
posted @ 2012-03-17 11:45 星语心愿~ 阅读(310) 评论(0) 推荐(0) 编辑
摘要: KDD Cup 2012:今年的数据挖掘相关会议在中国,充分体现了我们的IT企业在经历了原始社会后的第一次进步,开始注重机器学习这已经是国外巨头梦寐以求的热土。本次金牌赞助是华为、腾讯、百度,比赛分为两组,一组以研究微博用户关注为基础数据,预测未给出的用户关系;另外一组应该是对搜索引擎广告推荐的相关预测,数据还未出来大家拭目以待,3月1日。报名参赛与数据发布提交地址:http://www.kddcup2012.org/以下来自->官方网站http://www.kdd.org/kdd2012/This year’s KDD Cup is sponsored by Tencent Inc., 阅读全文
posted @ 2012-03-17 11:43 星语心愿~ 阅读(498) 评论(0) 推荐(0) 编辑