摘要: 这一篇整理一下pyquery这个解析库。还是菜,若有错误的地方,欢迎大家随时指正。。。。。。。(come on.......) pyquery:是一个css选择器,再使用时,也需要传入HTML文本来初始化一个PyQuery对象。但它的初始化方式有多种,比如直接传入字符串,传入URL,传入文件名,等等 阅读全文
posted @ 2019-08-05 15:14 梁十安 阅读(484) 评论(0) 推荐(0) 编辑
摘要: 上一篇记叙了xpath解析库的基本使用,这一篇整理一下Beautifulsoup这个解析库。依旧是菜,若有错误的地方,欢迎大家随时指正。。。。。。。(come on.......) 首先,还是先来当以那个html字符串 html = ''' <div id="container"> <ul clas 阅读全文
posted @ 2019-08-05 13:40 梁十安 阅读(855) 评论(0) 推荐(0) 编辑
摘要: 这两天看了一下python常用的三种解析库,写篇随笔,整理一下思路。太菜了,若有错误的地方,欢迎大家随时指正。。。。。。。(come on.......) 爬取网页数据一般会经过 获取信息->提取信息->保存信息 这三个步骤。而解析库的使用,则可以帮助我们快速的提取出我们需要的那被部分信息,免去了写 阅读全文
posted @ 2019-08-05 11:37 梁十安 阅读(849) 评论(0) 推荐(0) 编辑