随笔档案「2016年7月27日」：【python】lxml查找属性为指定值的节点 ... - 匡子语

2016年7月27日

摘要：假设有如下xml在/home/abc.xml位置我们要查找其中id=1的节点B的名称，可以利用lxml中xpath来查找：阅读全文

posted @ 2016-07-27 11:23 匡子语阅读(7759) 评论(0) 推荐(0)

摘要：这个爬虫的作用是，对于一个给定的url，查找页面里面所有的url连接并依次贪婪爬取主要需要注意的地方： 1.lxml.html.iterlinks() 可以实现对页面所有url的查找 2.获取页面要设置超时，否则遇到没有响应的页面，代码容易卡死 3.对所有异常的捕获 4.广度优先搜索实现具体代码阅读全文

posted @ 2016-07-27 09:48 匡子语阅读(561) 评论(0) 推荐(0)

匡子语

公告