2013 年 12月 25 日随笔档案 - lophy

RSS阅读器python实现概述

摘要：这边简单说一下最近倒腾的RSS阅读器的小东东，RSS阅读器估计很多人用过或者自己动手实现过。首先wudagang0123多年前提供的一个示例：http://bbs.chinaunix.net/forum.php?mod=viewthread&tid=1559320，在其基础上，增加了一些功能，可以解析ATOM和RSS的feed格式规范，优化了程序界面，主要目的是学习了下wxpython和XML解析的一些东西。程序预览如下： 1 def SaveChannelToFile(self): 2 impl = minidom.getDOMImplementation() 3... 阅读全文

posted @ 2013-12-25 13:55 lophy 阅读(1914) 评论(0) 推荐(1) 编辑

python简易爬虫来实现自动图片下载

摘要：菜鸟新人刚刚入住博客园，先发个之前写的简易爬虫的实现吧，水平有限请轻喷。估计利用python实现爬虫的程序网上已经有太多了，不过新人用来练手学习python确实是个不错的选择。本人借鉴网上的部分实现加以改造实现网页图片地址提取和下载。首先找到你感兴趣的网页，以bbs论坛为例，查看网页的源代码发现图片下载的链接地址类似如下：img-fa6533d1b03dee194f0636a69eea5c64.jpg 所以找到了属性href值就可以解析出我们的下载地址了（要加入当前url前缀才是绝对地址呦）。用python写个处理网页的函数可以这样 1 def getImg(html,page):... 阅读全文

posted @ 2013-12-25 13:08 lophy 阅读(2155) 评论(0) 推荐(0) 编辑

python爬虫-实现自动图片下载

摘要：菜鸟新人刚刚入住博客园，先发个之前写的简易爬虫的实现吧，水平有限请轻喷。估计利用python实现爬虫的程序网上已经有太多了，不过新人用来练手学习python确实是个不错的选择。本人也是借鉴网上的实现，稍稍改造一下。首先找到你感兴趣的网页，以bbs论坛为例，查看网页的源代码发现图片下载的链接地址类似如下：img-fa6533d1b03dee194f0636a69eea5c64.jpg 所以找到了属性href值就可以解析出我们的下载地址了（要加入当前url前缀才是绝对地址呦）。用python写个处理网页的函数可以这样 1 def getImg(html,page): 2 reg... 阅读全文

posted @ 2013-12-25 13:03 lophy 阅读(479) 评论(0) 推荐(0) 编辑

lophy

公告

RSS阅读器python实现概述

python简易爬虫来实现自动图片下载

python爬虫-实现自动图片下载