2018年6月8日
摘要: 分析:首先通过scrapy内置的xpath提取内容,发现为空,所以不行咯 采用正则re匹配出所有的<li>标签,也就是需要提取的所有内容 在把li标签通过resultTree = lxml.etree.HTML(articleBody),变成'lxml.etree._Element' 在通过resu 阅读全文
posted @ 2018-06-08 16:58 小白Amir 阅读(390) 评论(0) 推荐(0) 编辑