随笔分类 -  Python2/3-爬虫

现在主要是python3
摘要:以上标题的文章,先前照搬别人的,没注意加原创链接,也找不到了! 现在觉得好的内容都会加上原创链接:https://www.2cto.com/kf/201207/142453.html 阅读全文
posted @ 2017-11-16 23:39 诡道!!! 阅读(494) 评论(0) 推荐(0) 编辑
摘要:# -*- coding: utf-8 -*-import reclass Tool(): # 去除img标签,7位长空格 removeImg = re.compile('<img.*?>| {7}|') # 删除span标签 removeSpan = re.compile('<span.*?>| 阅读全文
posted @ 2017-09-17 18:07 诡道!!! 阅读(380) 评论(0) 推荐(0) 编辑
摘要:# -*- encoding:utf-8 -*-class transCookie: def __init__(self, cookie): self.cookie = cookie def stringToDict(self): ''' 将从浏览器上Copy来的cookie字符串转化为Scrapy 阅读全文
posted @ 2017-09-17 18:05 诡道!!! 阅读(731) 评论(0) 推荐(0) 编辑
摘要:转自:http://www.cnblogs.com/kennyhr/p/4018668.html(侵权可联系本人删掉) 一直以来技术群里会有新入行的同学提问关于urllib和urllib2以及cookielib相关的问题。所以我打算在这里总结一下,避免大家反复回答同样的问题浪费资源。 这篇属于教程类 阅读全文
posted @ 2017-09-17 17:25 诡道!!! 阅读(9769) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示