2020年11月10日

python-基于xpath的聚焦爬虫学习

摘要: XPath 是一门在 XML 文档中查找信息的语言。 XPath 是 XSLT 中的主要元素。 XQuery 和 XPointer 均构建于 XPath 表达式之上。 他可以适用于 多种语言,个人感觉比较实用。 解析原理 类似于bs4: from lxml import etree 实例化一个etr 阅读全文

posted @ 2020-11-10 22:12 沫戏回首 阅读(101) 评论(0) 推荐(0) 编辑

python-基于bs4的聚焦爬虫学习

摘要: 学习了基于bs4聚焦爬虫:bs4比较局限只能是python使用。个人感觉不是很好使用。 bs4数据解析原理:1、实例化一个beautifulSoup对象,并且将页面源码加载到该对象中 2、通过beautifulSoup对象中的相关属性或者方法进行标签定位和数据提取 下面是我的测试代码和Beautif 阅读全文

posted @ 2020-11-10 21:59 沫戏回首 阅读(126) 评论(0) 推荐(0) 编辑

导航