摘要: 一、主题式网络爬虫设计方案 1、主题式网络爬虫名称:爬取排行榜123网站之2019年上海企业前20强。 2、主题式网络爬虫爬取的内容:爬取网页2019年上海企业排名,区域,企业名称,2018年企业收入(万元)。 3、主题式网络爬虫设计方案概述:实现思路:选定想要爬取的网页,查看网页源码,找出规律,提 阅读全文
posted @ 2020-04-23 19:11 不困了o 阅读(481) 评论(0) 推荐(0) 编辑
摘要: import requests from bs4 import BeautifulSoup import pandas as pd url='https://tophub.today/n/KqndgxeLl9' headers={'User-Agent':url} r=requests.get(ur 阅读全文
posted @ 2020-03-21 19:18 不困了o 阅读(1095) 评论(0) 推荐(0) 编辑