2019年1月11日
摘要: from __future__ import unicode_literals import requests import itchat import time def get_news(): url = "http://open.iciba.com/dsapi" r = requests.get(url) contents = r.json()['content']... 阅读全文
posted @ 2019-01-11 18:02 若无未来 阅读(2534) 评论(0) 推荐(0) 编辑
摘要: pipelines.py settings.py 阅读全文
posted @ 2019-01-11 17:58 若无未来 阅读(273) 评论(0) 推荐(0) 编辑
摘要: QiushuSpider items 阅读全文
posted @ 2019-01-11 17:49 若无未来 阅读(332) 评论(0) 推荐(0) 编辑
摘要: spider items 阅读全文
posted @ 2019-01-11 17:45 若无未来 阅读(592) 评论(0) 推荐(0) 编辑
摘要: 准备工作 1. scrapy startproject Jobs 2. cd Jobs 3. scrapy genspider ZhaopinSpider www.zhaopin.com 4. scrapy crawl ZhaopinSpider 5. pip install diskcache 6 阅读全文
posted @ 2019-01-11 17:42 若无未来 阅读(907) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*- import scrapy import json import os import urllib import time from scrapy.http import Request from selenium import webdriver from selenium.webdriver.common.by import By from ... 阅读全文
posted @ 2019-01-11 17:30 若无未来 阅读(403) 评论(0) 推荐(0) 编辑