摘要:
出品Draw Something的OMGPOP 是如何在3周之内应对3600万用户的呢?采用了:1) Cloud Computing.2) NoSQL参见:How OMGPOP scaled to 36 million users in threeweeksOMGPOP can thank the cloud forits acquisition by Zyngaon Wednesday. The gaming startup, whose Draw Something iPhone app used cloud computing and a NoSQL database to scale 阅读全文
摘要:
Written byDaveBeckett• Filed underTechnologyAt Digg we have substantially rebuilt our infrastructure over the last year in what we call "Digg V4". This blog post gives a high-level view of the systems and technologies involved and how we use them. Read on to find out the secrets of the Dig 阅读全文
摘要:
Scraping with Python for Fun and Profit - PyCon India 2010 View more presentations from Abhishek Mishra 阅读全文
摘要:
Python抓取框架:Scrapy的架构Written by标点符on 2011年07月3日 in程序设计最近在学Python,同时也在学如何使用python抓取数据,于是就被我发现了这个非常受欢迎的Python抓取框架Scrapy,下面一起学习下Scrapy的架构,便于更好的使用这个工具。一、概述下图显示了Scrapy的大体架构,其中包含了它的主要组件及系统的数据处理流程(绿色箭头所示)。下面就来一个个解释每个组件的作用及数据的处理过程。二、组件1、Scrapy Engine(Scrapy引擎)Scrapy引擎是用来控制整个系统的数据处理流程,并进行事务处理的触发。更多的详细内容可以看下面的 阅读全文
摘要:
之前写过一个crawler。在这个过程中,也发现更多资料,将发几篇blog分享相关slides。互联网访问者大多数不是人类!研究报告显示,网站只有49%的访问者是人类,51%的流量来自于自动程序。51%中:20%来自搜索引擎;5%是黑客工具;5%是内容抓取;2%是垃圾留言发布工具;19%是竞争情报收集工具,如SEO和关键词分析。Crawling the web for fun and profit View more presentations from Federico Feroldi 阅读全文
摘要:
英文版:How Not To Sort By Average Rating中文版:基于用户投票的排名算法(五):威尔逊区间作者:阮一峰日期:2012年3月20日迄今为止,这个系列都在讨论,如何给出"某个时段"的排名,比如"过去24小时最热门的文章"。但是,很多场合需要的是"所有时段"的排名,比如"最受用户好评的产品"。这时,时间因素就不需要考虑了。这个系列的最后两篇,就研究不考虑时间因素的情况下,如何给出排名。一种常见的错误算法是: 得分 = 赞成票 - 反对票假定有两个项目,项目A是60张赞成票,40张反对票,项 阅读全文
摘要:
Bootstrap——优秀的开源前端框架2012-02-23 15:56 by 池建强, 2798 visits,收藏,编辑声明:本文已经首发于InfoQ中文站,版权所有,原文为《优秀的开源前端框架Bootstrap发布2.0.1版》,如需转载,请务必附带本声明,谢谢。Bootstrap是著名的社交网站、微博的先驱Twitter在2011年8月推出的开源WEB前端框架,集合CSS和HTML,使用了最新的浏览器技术,为快速WEB开发提供了一套前端工具包,包括布局、网格、表格、按钮、表单、导航、提示等等。使用Bootstrap可以构建出非常优雅的前端界面,而且占用资源非常小。Bootstrap发布 阅读全文
摘要:
Paul Sciarra,I'm a co-founder:We use python + heavily-modified Django at the application layer. Tornado and (very selectively) node.js as web-servers. Memcached and membase / redis for object- and logical-caching, respectively. RabbitMQ as a message queue. Nginx, HAproxy and Varnish for static-d 阅读全文
摘要:
Scalable Web Architectures: Common Patterns and Approaches - Web 2.0 Expo NYC View more PowerPoint from Cal Henderson 阅读全文
摘要:
Python在豆瓣的应用 View more presentations from Qiangning Hong 阅读全文