该文被密码保护。 阅读全文
posted @ 2017-09-17 18:12 诡道!!! 阅读(2) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*-import reclass Tool(): # 去除img标签,7位长空格 removeImg = re.compile('<img.*?>| {7}|') # 删除span标签 removeSpan = re.compile('<span.*?>| 阅读全文
posted @ 2017-09-17 18:07 诡道!!! 阅读(380) 评论(0) 推荐(0) 编辑
摘要: # -*- encoding:utf-8 -*-class transCookie: def __init__(self, cookie): self.cookie = cookie def stringToDict(self): ''' 将从浏览器上Copy来的cookie字符串转化为Scrapy 阅读全文
posted @ 2017-09-17 18:05 诡道!!! 阅读(728) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.cnblogs.com/kennyhr/p/4018668.html(侵权可联系本人删掉) 一直以来技术群里会有新入行的同学提问关于urllib和urllib2以及cookielib相关的问题。所以我打算在这里总结一下,避免大家反复回答同样的问题浪费资源。 这篇属于教程类 阅读全文
posted @ 2017-09-17 17:25 诡道!!! 阅读(9764) 评论(0) 推荐(0) 编辑