摘要: import scrapy class DmozSpider(scrapy.Spider): name ="dmoz" allowed_domains = ["dmoz.org"] start_urls = [ "https://dmoztools.net/Computers/Programming/Languages/Python/Resource... 阅读全文
posted @ 2018-03-17 22:53 一个处女座的程序猿 阅读(226) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-03-17 22:51 一个处女座的程序猿 阅读(3) 评论(0) 推荐(0) 编辑
摘要: #Py之Crawler:爬虫利用随机选取代理访问服务器的方法实现下载某网址上所有的图片到指定文件夹 import urllib.request import os import random def open_url(url): req=urllib.request.Request(url) req.add_header("User-Agent", "Mozilla/5.... 阅读全文
posted @ 2018-03-17 11:30 一个处女座的程序猿 阅读(175) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-03-17 11:19 一个处女座的程序猿 阅读(1) 评论(0) 推荐(0) 编辑