摘要: 在网页节点中,可以定义id、class或其他属性。节点间有层次关系,网页中要通过XPath或CSS选择器定位一个或多个节点。在页面解析时,可利用XPath或CSS选择器提取某个节点,再调用相应方法获取它的正文内容或者属性,就可提取到想要的信息。在python中常用的解析库有lxml、Beautifu 阅读全文
posted @ 2019-03-08 16:03 远方那一抹云 阅读(1022) 评论(0) 推荐(0) 编辑