摘要: #coding:utf-8a=['a','b','c']b=[1,2,3]s=zip(a,b)d={}for k,v in s: d[k]=vprint d 版权声明:本文为博主原创文章,未经博主允许不得转载。 阅读全文
posted @ 2013-11-12 18:17 前行者2011 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 其实python里面有xml.dom模块,但是这次却不能用,为啥呢?因为服务器传回的html从xml角度看不是良构的,没有闭合的标签、没有被注释掉的javascript和css,xml.dom没法处理,这个时候要用sgmllib。sgmllib.py 包含一个重要的类: SGMLParser。SGM... 阅读全文
posted @ 2013-11-12 18:11 前行者2011 阅读(136) 评论(0) 推荐(0) 编辑
摘要: #获取链接#coding:utf-8from sgmllib import SGMLParserclass urlparser(SGMLParser): def reset(self): self.result=[] SGMLParser.reset(self) ... 阅读全文
posted @ 2013-11-12 16:52 前行者2011 阅读(100) 评论(0) 推荐(0) 编辑
摘要: #coding:utf-8from sgmllib import SGMLParserclass GetIdList(SGMLParser): def reset(self): self.IDlist=[] self.flag=False self.g... 阅读全文
posted @ 2013-11-12 15:52 前行者2011 阅读(145) 评论(0) 推荐(0) 编辑
摘要: SGMLParser 将 HTML 分解成有用的片段, 比如开始标记和结束标记。一旦它成功地分解出某个数据为一个有用的片段,它会根据 所发现的数据,调用一个自身内部的方法。为了使用这个分析器,您需要子类化 SGML- Parser类,并且覆盖这些方法。SGMLParser类里面包含了很多内部方法,开... 阅读全文
posted @ 2013-11-12 15:50 前行者2011 阅读(80) 评论(0) 推荐(0) 编辑
摘要: http://www.open-open.com/lib/view/1329700631343SGMLParser 将 HTML 分解成有用的片段, 比如开始标记和结束标记。一旦它成功地分解出某个数据为一个有用的片段,它会根据 所发现的数据,调用一个自身内部的方法。为了使用这个分析器,您需要子类化 ... 阅读全文
posted @ 2013-11-12 15:25 前行者2011 阅读(129) 评论(0) 推荐(0) 编辑