摘要: 一、scrapy介绍和安装 # requests,selenium,bs4(模块) >专业爬虫:爬虫框架(scrapy),在固定位置写固定代码,就能完成爬虫的功能 # Scrapy是一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速、简单、可扩展的方式 阅读全文
posted @ 2022-08-03 20:41 马氵寿 阅读(294) 评论(0) 推荐(0) 编辑
摘要: 一、 xpath的基本使用 简介:XPath 是一门在 XML 文档中查找信息的语言 # 一般解析库都会有子的的搜索标签的方法,一般都会支持css和xpath # 一般使用: div 找div标签 / 找当前路径下的标签 /div/a // 找当前路径子子孙孙下的标签 -/div//a . 表示当前 阅读全文
posted @ 2022-08-03 18:06 马氵寿 阅读(82) 评论(0) 推荐(0) 编辑