2017年9月18日
摘要: 今日头条是一个js动态加载的网站,尝试了两种方式爬取,一是页面直接提取,一是通过接口提取: version1:直接页面提取 问题:title = tree.xpath('//a[@class="link title"]/text()')提取内容失败,用xpath check插件提取成功 versio 阅读全文
posted @ 2017-09-18 13:41 Ryana 阅读(19757) 评论(0) 推荐(1) 编辑