随笔分类 -  爬虫

摘要:阅读目录 第一篇:爬虫基本原理 第二篇:请求库之requests,selenium 第三篇:解析库之re、beautifulsoup、pyquery 第四篇:存储库之mongodb,redis,mysql 第五篇:爬虫高性能相关 第六篇:Scrapy框架 第七篇:分布式爬虫 阅读全文
posted @ 2018-03-30 09:57 明天OoO你好 阅读(210) 评论(0) 推荐(0) 编辑
摘要:1 # -*- coding:UTF-8 -*- 2 import requests, time 3 import json 4 from bs4 import BeautifulSoup as bp 5 6 t3 = time.time() 7 ths = [] # 存放线程 8 9 10 def 阅读全文
posted @ 2017-11-01 10:35 明天OoO你好 阅读(383) 评论(0) 推荐(0) 编辑
摘要:# -*- coding:UTF-8 -*- import requests,time from collections import OrderedDict import threading from bs4 import BeautifulSoup as bp t3 = time.time() ths = [] # 存放线程 def get(num): dic =... 阅读全文
posted @ 2017-06-02 15:38 明天OoO你好 阅读(852) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示