摘要: xpath 特点:树状结构、逐层展开、逐层定位、寻找独立节点。 类似于使用jQuery进行元素搜索 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也能分析html结构), 利用其lxml.html的xpath对html进行分析 阅读全文
posted @ 2017-12-05 20:14 Weapon_liu 阅读(166) 评论(0) 推荐(0) 编辑
摘要: 当我面有数据需要保存时,第一时间一般会想到写到一个txt文件中,当然,数据量比较大的时候还是写到数据库比较方便管理,需要进行网络传输时要序列化,json化。下面主要整理一下平时用的最多的写入到文件中,一般以txt结尾,linux里不会以后缀来区分文件类型,后缀可以随便,也可以没有。 python读写 阅读全文
posted @ 2017-12-05 19:54 Weapon_liu 阅读(905) 评论(0) 推荐(0) 编辑