2018 年 6月 8 日随笔档案 - 小白Amir

2018年6月8日

摘要：分析：首先通过scrapy内置的xpath提取内容，发现为空，所以不行咯采用正则re匹配出所有的<li>标签，也就是需要提取的所有内容在把li标签通过resultTree = lxml.etree.HTML(articleBody)，变成'lxml.etree._Element' 在通过resu 阅读全文

posted @ 2018-06-08 16:58 小白Amir 阅读(395) 评论(0) 推荐(0) 编辑