摘要: 一 .创建一个爬虫工程 scrapy startproject tongcheng #创建一只爬虫 scrapy genspider zufang 域名(xa.58.com/zufang/) 二.配置setting文件 ROBOTSTXT_OBEY = Ture 改为 Fales #打印日志的文件 阅读全文
posted @ 2018-11-14 21:45 会飞的bin 阅读(1945) 评论(0) 推荐(0) 编辑
摘要: DHT是什么 DHT全称叫分布式哈希表(Distributed Hash Table),是一种分布式存储方法。在不需要服务器的情况下,每个客户端负责一个小范围的路由,并负责存储一小部分数据,从而实现整个DHT网络的寻址和存储。 各种博客已经有很多关于DHT介绍,这里就不详细列举了 加入DHT网络可以 阅读全文
posted @ 2018-11-13 15:01 会飞的bin 阅读(582) 评论(0) 推荐(0) 编辑
摘要: 会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份,Session通过在服务器端记录信息确定用户身份。 本章将系统地讲述Cookie与Session机制,并比较说明什么时候不能用C 阅读全文
posted @ 2018-10-25 11:34 会飞的bin 阅读(94) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-10-25 11:31 会飞的bin 阅读(0) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-10-18 17:15 会飞的bin 阅读(0) 评论(0) 推荐(0) 编辑