1.分析 ,要抓取的页面的信息以及对应的源码信息
blog.sina.com.cn/s/blog 93dc666c0101b1bj.html
2.代码模块:
导入正则表达的模块
导入url相关的模块
利用page。read()获取页面的信息,再将页面当做字符串,传入到getImg方法内,利用正则表达式,匹配你要的字符串信息,然后,在利用urllib包的urlretrieve()下载,你要的图片。
这个是urllib模块内的方法的详解:http://www.jb51.net/article/42630.htm