摘要: 前言 本篇继续lxml.etree学习,在线访问接口,通过接口返回的html,解析出想要的text文本内容 环境准备: python 3.6 lxml requets 定位目标 爬取我的博客首页 "https://www.cnblogs.com/yoyoketang/" 左侧栏个人基本信息 先f12 阅读全文
posted @ 2018-09-17 16:23 上海-悠悠 阅读(6407) 评论(0) 推荐(0) 编辑
摘要: 前言 之前分享过一个python爬虫beautifulsoup框架可以解析html页面,最近看到lxml框架的语法更简洁,学过xpath定位的,可以立马上手。 使用环境: python 3.6 lxml 4.2.4 lxml安装 使用pip安装lxml库 $ pip install lxml pip 阅读全文
posted @ 2018-09-17 11:51 上海-悠悠 阅读(6274) 评论(0) 推荐(0) 编辑