02 2021 档案
摘要:Linux 源码安装 下载地址:http://redis.io/download,下载最新稳定版本。 本教程使用的最新文档版本为 2.8.17,下载并安装: # wget http://download.redis.io/releases/redis-6.0.8.tar.gz# tar xzf re
阅读全文
摘要:1.更换访问ip和user_agent user_agent_list = [ "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 " "(KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"
阅读全文
摘要:1.可以在原来的items的基础上添加一个新的item类型 class imgItem(scrapy.Item): # define the fields for your item here like: title = scrapy.Field() link = scrapy.Field() 2.
阅读全文
摘要:1.在scrapy.cfg同路径下创建run.py 2.写入 # -*- coding: utf-8 -*- from scrapy import cmdline name = 'douban' cmd = 'scrapy crawl {0}'.format(name) cmdline.execut
阅读全文
摘要:cd 文件目录(进入到你的一个文件中) scrapy startproject 项目名字 cd 项目名字 (进入这个爬虫项目) scrapy genspider (-t crwal) 爬虫名字 运行爬虫:scrapy crawl 爬虫名字 先注释掉allowed_domains settings的四
阅读全文
摘要:from selenium import webdriver from time import sleep from selenium.webdriver.chrome.options import Options # 实现无可视化界面 from selenium.webdriver import
阅读全文
摘要:主程序 # 做一个滑动验证码的通过 from selenium import webdriver from lxml import etree from time import sleep from selenium.webdriver import ChromeOptions, ActionCha
阅读全文

浙公网安备 33010602011771号