摘要: 详情点击 爬虫框架之scrapy 阅读全文
posted @ 2017-05-18 21:37 amchen 阅读(150) 评论(0) 推荐(0) 编辑
摘要: 一致性哈希算法 使用场景 现在我们假设有100台redis data服务器,一份数据101进来的时候,以散列公式hash(i)&100,计算所存放的服务器,假设hash(i) = i,那么数据被散列到标号为1的服务器,然后这个时候服务器新增了一台,然后散列公式为hash(i)%101,这个时候请求访 阅读全文
posted @ 2017-05-18 21:32 amchen 阅读(242) 评论(0) 推荐(0) 编辑
摘要: Scrapy介绍 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。所谓网络爬虫,就是一个在网上到处或定向抓取数据的程序,当然,这种说法不够专业,更专业的描述就是,抓取特定网站网页的HTML数据。抓取网页的一般方法是 阅读全文
posted @ 2017-05-18 19:21 amchen 阅读(479) 评论(0) 推荐(0) 编辑
摘要: RESTful API现在很流行,这里是它的介绍 理解RESTful架构和 RESTful API设计指南.按照Django的常规方法当然也可以实现REST,但有一种更快捷、强大的方法,那就是 Django REST framework.它是python的一个模块,通过在Django里面配置就可以把 阅读全文
posted @ 2017-05-18 14:13 amchen 阅读(258) 评论(0) 推荐(0) 编辑
摘要: requests模块 Python标准库中提供了:urllib、urllib2、httplib等模块以供Http请求,但是,它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作,甚至包括各种方法覆盖,来完成最简单的任务。 Requests 是使用 Apache2 Licen 阅读全文
posted @ 2017-05-18 10:17 amchen 阅读(278) 评论(0) 推荐(0) 编辑