网络编程 - 随笔分类 - 牛皮糖NewPtone

使用HTMLParser模块解析HTML页面

摘要：HTMLParser是python用来解析html和xhtml文件格式的模块。它可以分析出html里面的标签、数据等等，是一种处理html的简便途径。HTMLParser采用的是一种事件驱动的模式，当HTMLParser找到一个特定的标记时，它会去调用一个用户定义的函数，以此来通知程序处理。它主要的回调函数的命名都是以handler_开头的，都HTMLParser的成员函数。当我们使用时，就从HTMLParser派生出新的类，然后重新定义这几个以handler_开头的函数即可。和在htmllib中的解析器不同，这个解析器并不是基于sgmllib模块的SGML解析器。htmllib模块和sgm. 阅读全文

posted @ 2011-08-30 13:32 牛皮糖NewPtone 阅读(5828) 评论(0) 推荐(0)

Python:urllib 和urllib2之间的区别

摘要：作为一个Python菜鸟，之前一直懵懂于urllib和urllib2，以为2是1的升级版。今天看到老外写的一篇《Python: difference between urllib and urllib2》才明白其中的区别。You might be intrigued by the existence of two separate URL modules in Python -urllibandurllib2. Even more intriguing: they are not alternatives for each other. So what is the difference be 阅读全文

posted @ 2011-08-01 17:10 牛皮糖NewPtone 阅读(61196) 评论(0) 推荐(2)

Python 标准库 urllib2 的使用细节

摘要：刚好用到，这篇文章写得不错，转过来收藏。转载自道可道 | Python 标准库 urllib2 的使用细节Python 标准库中有很多实用的工具类，但是在具体使用时，标准库文档上对使用细节描述的并不清楚，比如 urllib2 这个 HTTP 客户端库。这里总结了一些 urllib2 库的使用细节。1 Proxy 的设置 2 Timeout 设置 3 在 HTTP Request 中加入特定的 Header 4 Redirect 5 Cookie 6 使用 HTTP 的 PUT 和 DELETE 方法 7 得到 HTTP 的返回码 8 Debug Log 1 Proxy 的设置urllib2 阅读全文

posted @ 2011-08-01 16:23 牛皮糖NewPtone 阅读(140890) 评论(0) 推荐(9)

关于Django的一个NB网站

摘要：今天无意发现一个老外的关于Django的网站，提供各种Django框架，小插件，下了几个试了下，相当不错啊传送门在这http://www.djangopackages.com/ 阅读全文

posted @ 2011-04-19 17:45 牛皮糖NewPtone 阅读(611) 评论(0) 推荐(0)

随笔分类 - 网络编程

公告