会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
会飞的bin
博客园
首页
新随笔
联系
订阅
管理
2018年11月14日
使用爬虫scrapy库爬取58同城出租房的联系方式地址
摘要: 一 .创建一个爬虫工程 scrapy startproject tongcheng #创建一只爬虫 scrapy genspider zufang 域名(xa.58.com/zufang/) 二.配置setting文件 ROBOTSTXT_OBEY = Ture 改为 Fales #打印日志的文件
阅读全文
posted @ 2018-11-14 21:45 会飞的bin
阅读(2010)
评论(0)
推荐(0)
2018年11月13日
爬虫dht
摘要: DHT是什么 DHT全称叫分布式哈希表(Distributed Hash Table),是一种分布式存储方法。在不需要服务器的情况下,每个客户端负责一个小范围的路由,并负责存储一小部分数据,从而实现整个DHT网络的寻址和存储。 各种博客已经有很多关于DHT介绍,这里就不详细列举了 加入DHT网络可以
阅读全文
posted @ 2018-11-13 15:01 会飞的bin
阅读(665)
评论(0)
推荐(0)
2018年10月25日
Cookie/Session机制详解
摘要: 会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。常用的会话跟踪技术是Cookie与Session。Cookie通过在客户端记录信息确定用户身份,Session通过在服务器端记录信息确定用户身份。 本章将系统地讲述Cookie与Session机制,并比较说明什么时候不能用C
阅读全文
posted @ 2018-10-25 11:34 会飞的bin
阅读(101)
评论(0)
推荐(0)
Shell命令--文本目录
该文被密码保护。
阅读全文
posted @ 2018-10-25 11:31 会飞的bin
阅读(0)
评论(0)
推荐(0)
2018年10月18日
post 和 get 请求的区别
该文被密码保护。
阅读全文
posted @ 2018-10-18 17:15 会飞的bin
阅读(0)
评论(0)
推荐(0)
公告