12 2017 档案
摘要:import random import requests url='http://xxx' headers={ 'Authorization':'xxx', 'Content-Type':'application/json' } data0="" for i in range(1,20): uid=str(i) score=str(round(random.u...
阅读全文
摘要:PhantomJS是一种没有界面的浏览器,便于爬虫 1、PhantomJS下载 2、phantomjs无须安装driver,还有具体的api参考: http://phantomjs.org/api/command-line.html 3、配置config.py 4、爬取如下spider.py
阅读全文
摘要:流程如下: #1 配置好MongoDB的依赖库 #2 模拟搜索街拍的请求信息 #3 通过请求返回的json返回的url地址再次爬取 #4 爬取新的url地址,并爬取相关的图片地址 #5 获取url地址,并将爬取数据写至MongoDB,且通过二进制流下载下来,若文件相同,则通过md5判断 1、相关配置
阅读全文
摘要:1、下载MongoDB 地址:【https://www.mongodb.com/download-center?jmp=nav#atlas】好像需要注册,可以从下面下载 【http://dl.mongodb.org/dl/win32/x86_64】 2、安装MongoDB 3、在安装路径下创建数据库
阅读全文