2017 年 5月 18 日随笔档案 - amchen

2017年5月18日

摘要：详情点击爬虫框架之scrapy 阅读全文

posted @ 2017-05-18 21:37 amchen 阅读(153) 评论(0) 推荐(0) 编辑

摘要：一致性哈希算法使用场景现在我们假设有100台redis data服务器，一份数据101进来的时候，以散列公式hash(i)&100，计算所存放的服务器，假设hash(i) = i,那么数据被散列到标号为1的服务器,然后这个时候服务器新增了一台，然后散列公式为hash(i)%101，这个时候请求访阅读全文

posted @ 2017-05-18 21:32 amchen 阅读(245) 评论(0) 推荐(0) 编辑

爬虫框架-scrapy

摘要： Scrapy介绍 Scrapy是一个为了爬取网站数据，提取结构性数据而编写的应用框架。可以应用在包括数据挖掘，信息处理或存储历史数据等一系列的程序中。所谓网络爬虫，就是一个在网上到处或定向抓取数据的程序，当然，这种说法不够专业，更专业的描述就是，抓取特定网站网页的HTML数据。抓取网页的一般方法是阅读全文

posted @ 2017-05-18 19:21 amchen 阅读(481) 评论(0) 推荐(0) 编辑

利用Django实现RESTful API

摘要： RESTful API现在很流行，这里是它的介绍理解RESTful架构和 RESTful API设计指南.按照Django的常规方法当然也可以实现REST，但有一种更快捷、强大的方法，那就是 Django REST framework.它是python的一个模块，通过在Django里面配置就可以把阅读全文

posted @ 2017-05-18 14:13 amchen 阅读(260) 评论(0) 推荐(0) 编辑

requests之爬虫

摘要： requests模块 Python标准库中提供了：urllib、urllib2、httplib等模块以供Http请求，但是，它的 API 太渣了。它是为另一个时代、另一个互联网所创建的。它需要巨量的工作，甚至包括各种方法覆盖，来完成最简单的任务。 Requests 是使用 Apache2 Licen 阅读全文

posted @ 2017-05-18 10:17 amchen 阅读(278) 评论(0) 推荐(0) 编辑

amchen

公告