会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
sakuraxx
每天进步一点点,不要停止前进的脚步~
博客园
首页
新随笔
联系
订阅
管理
2019年4月14日
【Python数据采集】提取页面内容的几种手段
摘要: 前言 在我们获取了网页的信息后,往往需要对原始信息进行提取,得到我们想要的数据。对信息的提取方式主要有以下几种:正则表达式、XPath、BeautifulSoup。本篇博客主要总结这三种方式的基本语法,以及举一些例子来说明如何使用这些方法。 正则表达式 什么是正则表达式? 正则表达式是使用某种预定义
阅读全文
posted @ 2019-04-14 15:39 sakuraxx
阅读(2772)
评论(0)
推荐(0)
编辑
公告