随笔分类 - 爬虫
摘要:阅读目录 第一篇:爬虫基本原理 第二篇:请求库之requests,selenium 第三篇:解析库之re、beautifulsoup、pyquery 第四篇:存储库之mongodb,redis,mysql 第五篇:爬虫高性能相关 第六篇:Scrapy框架 第七篇:分布式爬虫
阅读全文
摘要:1 # -*- coding:UTF-8 -*- 2 import requests, time 3 import json 4 from bs4 import BeautifulSoup as bp 5 6 t3 = time.time() 7 ths = [] # 存放线程 8 9 10 def
阅读全文
摘要:# -*- coding:UTF-8 -*- import requests,time from collections import OrderedDict import threading from bs4 import BeautifulSoup as bp t3 = time.time() ths = [] # 存放线程 def get(num): dic =...
阅读全文