摘要: 用selenium爬取空间 from selenium import webdriver from lxml import etree import time pro = webdriver.Chrome(executable_path=r'C:\Users\古月蜀黍\Desktop\chromedriver_win32\chromedriver.exe') pro.get(url='https... 阅读全文
posted @ 2018-07-06 19:39 古月蜀黍 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 对加密数据的爬取 import requests from lxml import etree import base64 import os from urllib import request url = 'http://jandan.net/ooxx/page-46' headers = { 阅读全文
posted @ 2018-07-06 13:52 古月蜀黍 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 一.requests 1. requests.get(url,headers) 2.requests.post(url, headers, data) 二.urllib from urllib import request 1.request.urlretreieve(url, filename) 阅读全文
posted @ 2018-07-06 13:38 古月蜀黍 阅读(100) 评论(0) 推荐(0) 编辑