摘要: 用python批量下载一个网页中的图片,需要用到扩展库来解析html代码。有三种方法,一是用微软提供的扩展库win32com来操作IE,二是用selenium的webdriver,三是用python自带的HTMLParser解析。win32com可以获得类似js里面的document对象,不过是只读的(文档都没找到)。selenium则提供了Chrome,IE,FireFox等的支持,每种浏览器都有execute_script和find_element_by_xx方法,可以方便的执行js脚本(包括修改元素)和读取html里面的元素。不足是selenium只提供对python2.6和2.7的支持 阅读全文
posted @ 2013-04-22 12:51 mascure 阅读(786) 评论(0) 推荐(0) 编辑