摘要: 按学科分类【中图分类】 共计三十余万条科技报告数据 爬取的网址:https://www.nstrs.cn/kjbg/navigation !!! 如果要完整地跑起来代码,需要先看一下我的这篇博客,完成IP代理池的相关配置: https://www.cnblogs.com/rainbow-1/p/16 阅读全文
posted @ 2022-09-24 14:14 靠谱杨 阅读(589) 评论(0) 推荐(0) 编辑
摘要: 关注我的公众号【靠谱杨阅读人生】回复ProxyPool可以免费获取网盘链接。 也可自行搜索下载:https://github.com/Python3WebSpider/ProxyPool.git 1、下载之后打开setting文件修改redis相关配置。 2、之后开启本机redis服务,就可以直接运 阅读全文
posted @ 2022-09-24 13:30 靠谱杨 阅读(899) 评论(0) 推荐(0) 编辑
摘要: python爬虫随机headers伪装fake_useragent fake_useragent 库 调用方法ua.random可以随机返回一个headers(User-Agent) from fake_useragent import UserAgent # 下载:pip install fake 阅读全文
posted @ 2022-09-24 13:13 靠谱杨 阅读(990) 评论(0) 推荐(0) 编辑