随笔分类 - Python2/3-爬虫
现在主要是python3
摘要:以上标题的文章,先前照搬别人的,没注意加原创链接,也找不到了! 现在觉得好的内容都会加上原创链接:https://www.2cto.com/kf/201207/142453.html
阅读全文
摘要:# -*- coding: utf-8 -*-import reclass Tool(): # 去除img标签,7位长空格 removeImg = re.compile('<img.*?>| {7}|') # 删除span标签 removeSpan = re.compile('<span.*?>|
阅读全文
摘要:# -*- encoding:utf-8 -*-class transCookie: def __init__(self, cookie): self.cookie = cookie def stringToDict(self): ''' 将从浏览器上Copy来的cookie字符串转化为Scrapy
阅读全文
摘要:转自:http://www.cnblogs.com/kennyhr/p/4018668.html(侵权可联系本人删掉) 一直以来技术群里会有新入行的同学提问关于urllib和urllib2以及cookielib相关的问题。所以我打算在这里总结一下,避免大家反复回答同样的问题浪费资源。 这篇属于教程类
阅读全文