随笔分类 - 爬虫
摘要:from twisted.web.client import getPage #模块功能:socket对象,自动完成移除 from twisted.internet import reactor #模块功能:事件循环(所有的socket对象都移除) from twisted.internet import defer #模块功能:defer.Deferred,特殊的socket...
阅读全文
摘要:class HttpRequest: def __init__(self,sk,host,callback): self.socket = sk self.host = host self.callback = callback def fileno(self): return self.socket.fileno(...
阅读全文
摘要:2018/07/04 d91 爬虫入门 一、爬虫 1.基本操作(自动投票、点赞) - 登陆任意网站(伪造浏览器的任何行为) 2.性能相关(多线程、进程) - 并发方案: - 异步IO:gevent/Twisted/asyncio/aiohttp #现在都采取这种 - 自定义异步IO模块 - IO多路
阅读全文