02 2021 档案

摘要:今天来总结最后一种说句解析的方式——XPath。 XPath是一门在XML文档中查找信息的语言,用于在XML文档中通过元素和属性进行导航。 XPath简介 下面来简单介绍一下XPath。 XPath的特点 XPath使用路径表达式在XML文档中进行导航 XPath包含一个标准函数库 XPath是XS 阅读全文
posted @ 2021-02-28 12:28 银色的音色 阅读(635) 评论(0) 推荐(0) 编辑
摘要:我们在上一章讲了最直接的索引方法——正则,今天今天讲一个稍微好用一点的数据解析的方法:beautifulsoup4。bs4是在python中独有的一种解析方式,而前面所讲的正则的解析方法,顾名思义,是基于正则表达式的,所以是不限制编程语言的。 通过bs4进行数据解析的流程 按照前面讲过的数据解析原理 阅读全文
posted @ 2021-02-21 01:30 银色的音色 阅读(2276) 评论(0) 推荐(0) 编辑
摘要:我们前面的爬虫基本上都是通用爬虫,下面我们要讲到的是聚焦爬虫。聚焦爬虫得实现就要求我们在数据持久化前对指定的数据进行解析。聚焦爬虫用于爬取页面中指定部分的数据,而不是整个数据。隐藏我们就需要对爬到底数据按照一定方式解析。我们一般用下面三种方法实现数据解析。 正则解析 beautifulsoup xp 阅读全文
posted @ 2021-02-15 01:08 银色的音色 阅读(113) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示