摘要: 前言 在我们获取了网页的信息后,往往需要对原始信息进行提取,得到我们想要的数据。对信息的提取方式主要有以下几种:正则表达式、XPath、BeautifulSoup。本篇博客主要总结这三种方式的基本语法,以及举一些例子来说明如何使用这些方法。 正则表达式 什么是正则表达式? 正则表达式是使用某种预定义 阅读全文
posted @ 2019-04-14 15:39 sakuraxx 阅读(2772) 评论(0) 推荐(0) 编辑