会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Loading
超香Q的五香卤猪脚
博客园
首页
新随笔
联系
订阅
管理
2020年8月11日
爬虫(五)数据清洗-xpath、BeautifulSoup模块
摘要: xpath介绍和lxml安装 xpath表达式 如果正则表达式用的不好,处理html文档很累,有没有其他的方法? 有!就是用xpath,我们可以先将html文件转成xml文档,然后用xpath查找html节点或元素 我们需要安装lxml模块来支持xpath的操作 安装依赖 pip install l
阅读全文
posted @ 2020-08-11 16:09 Binzichen
阅读(734)
评论(0)
推荐(0)
编辑
公告