2018 年 2月 19 日随笔档案 - 公众号python学习开发

2018年2月19日

摘要： from:https://www.cnblogs.com/ospider/p/5911339.html 最近要做下微信爬虫，之前写个小东西都是直接用正则提取数据就算了，如果需要更稳定的提取数据，还是使用 xpath 定位元素比较可靠。周末没事，从爬虫的角度研究了一下 python xml 相关的库。阅读全文

posted @ 2018-02-19 14:20 公众号python学习开发阅读(2805) 评论(0) 推荐(0) 编辑

lxml etree的一个问题

摘要： <div> <a href="xxxx">123</a> <a href="xxxx">45</a><div> <div> 123 45<div> 请问使用lxml的etree，etree.xpath 怎么一种方式获取内容 div里的12345? 方案2.etree改用document_fromst 阅读全文

posted @ 2018-02-19 13:30 公众号python学习开发阅读(249) 评论(0) 推荐(0) 编辑

一起来学python

android逆向

公告