09 2009 档案
摘要:自从上次从国家地理上取得图片之后,我又产生新的想法:要从Tripntale上取得照片.Tripntale是一个很不错网络相册,尤其是对那些比较喜欢旅游的同志。按照之前在提取国家地理照片的思路:1. 轮询每个照片的网页Tripntale的相册目录结构是http://www.tripntale.com/pic/8238/424541,其中8343代表某个相册的ID,429749是该相册下照片的ID,可...
阅读全文
摘要:PyQt是一个GUI库,是将Python和Qt结合在一起的产物。而Qt是目前比较成功和强大的GUI库。可以通过访问官方主页来获得更多信息。PyQt的模块管理:QtCore主要负责一些非GUI的功能,包括时间(time),文件(files)和文件夹(directories),各种数据类型(data types),流(stream),urls,mime类型,线程(threads)和过程(process...
阅读全文
摘要:本文试图以翻译的形式对Pylot做介绍,让大家熟悉一下Pylot以及它的基本。Pylot是什么?Pylot是一款开源的测试web service性能和扩展性的工具,它运行HTTP 负载测试,这对容量计划,确定基准点,分析以及系统调优都很有用处。Pylot产生并发负载(HTTP Requests),检验服务器响应,以及产生带有metrics的报表。通过GUI或者shell/console来执行和监视...
阅读全文
摘要:在我们登录网页的时候,如果某账户刚刚登录,系统会有如下提示:本文就是讲述如何用PAMIE处理这种POPUP window。主要是如何选择POPUP window以及点击上面的"OK"或者"Cancel"按钮。对弹出窗口的处理,主要都在winGuiAuto.py中。import winGuiAuto# 获取得的hwnd是一个列表hwnd = winGuiAuto.findTopWindows("Wi...
阅读全文
摘要:PAMIE的全称是Python Automated Module For Internet Explorer,顾名思义,PAMIE是一个实现IE自动化的模块。PAMIE的官方网站提供了最新模块的下载,但由于是个人开发的缘故,其他文档,常见问题解答之类的基本没有更新,在下载最新版本之后,主页上提供的资料有好多是错的,大家在用的时候要务必注意这一点,最明显的一个例子是我上篇文章里面说的,还有一些方法名...
阅读全文
摘要:最近在研究使用PAMIE的时候,遇到了问题:ImportError: No module named cPAMIE.当我在拷贝解压后的PAM30.py和winGuiAuto.py到C:\Python26\Lib\site-packages目录下后,在开启Python自带的IDLE之后,输入from cPAMIE import PAMIE,却得到ImportError: No module name...
阅读全文
摘要:Tornado是一个用Python写的相对简单的、不设障碍的Web服务器架构,用以处理上万的同时的连接口,让实时的Web服务通畅起来。虽然跟现在的一些用Python写的Web架构相似,比如Google的Diango,但Tornado更注重速度,能够处理海量的同时发生的流量。FriendFeed的联合创始人Bret Taylor的博客里介绍了更多,他说:把Tornado开源,FriendFeed和F...
阅读全文
摘要:这里有两个需求: 删除某个目录以及子目录下的所有.svn文件 删除某个文件夹下所有文件 在Python中,文件操作主要来自os模块,主要方法如下:os.listdir(dirname):列出dirname下的目录和文件os.getcwd():获得当前工作目录os.curdir:返回当前目录('.')os.chdir(dirname):改变工作目录到dirnameos.path.isdir(name...
阅读全文
摘要:今天在学习Python Cookbook的时候,发现一句语法from __future__ import division,很奇怪__future__这个名字,网上搜了一下,原来是很有用的一个模块。详细说明见这里。按照官方的解释,至少确保在2.1之前版本的Python可以正常运行一些新的语言特性,需要使用语句 'from __future__ import *'。举例来说:# Enable nes...
阅读全文
摘要:本例是用Python Image Library(PIL)的Image模块进行图片处理,并把保存的图片设置成桌面。在此之前,当然还是要用urllib取得网站的response。PIL 是Python下最有名的影像处理套件,由许多不同的模块所组成,并且提供了许多的处理功能,允许我们在简单的Python程序里进行影像的处理。 使用像 PIL 这样的程序库套件可以帮助我们把精力集中在影像处理的工作本身,...
阅读全文
摘要:在完成得到某一年所有图片之后,不由得想优化一下:把国家地理历年来的每日图片都取回来。上网搜索了一下,国家地理每日图片是从2001年开始的,我们可以继续优化得到以下的代码:[代码]这个时候遇到一个问题,有些请求会返回HTTP Status 404, 就需要对response进行处理,不存在的文件要跳过。[代码]except语句可以打印出对应的链接,以及对应的error code,事后可以验证这种处理...
阅读全文
摘要:昨天的脚本(这里)在公司的XP系统下调试通过了,不知道为什么在我的Vista下还有点问题。
以下是一些总结:
1。 批量参数化图片地址
注意到我们请求地址一般是http://photography.nationalgeographic.com/ngs_pod_ext/searchPOD.jsp?month=09&day=04&year=2009&page=
然后页面会自动跳...
阅读全文
摘要:1. 利用urllib2.urlopen取得页面的内容 2. 利用正则表达式取得src标签为.jpg的URL 3. 保存图片 urllib2是python的一个获取url(Uniform Resource Locators,统一资源定址器)的模块。它用urlopen函数的形式提供了一个非常简洁的接口。这使得用各种各样的协议获取url成为可能。它同时 也提供了一个稍微复杂的接口来处理常见的状况-如基...
阅读全文
摘要:“你们觉得开心网有意思吗?” “没什么意思阿。” “那不玩开心网行不行?” “不行!” “为什么?” “已经成了习惯!闲下来得时候就会不由自主得打开开心网。”
阅读全文
摘要:刚刚在谷歌中文网站管理员博客上看到一个很好玩的工具,可以让别人找到你 ,在这里点 ,然后在 修改你的地址,点击预览更改可以看到你的效果,然后点获得代码,就可以将生成的JS代码配置在你的网页,个人博客上,别人就可以很方便的找到你了。 意见:要是能提供两个输入框,让用户可以查询任意两个地方就更好了
阅读全文
摘要:在线词典的主要流程: 1. 提交一个POST请求到在线词典网站 1.1 如http://dict.cn/ws.php?q=,服务器将会返回一个xml格式的文本。 1.1.1 利用minidom解析这个XML,如果只要得到翻译,就取def节点的值,如果需要例句,就取每个sent节点下的orig和trans节点的值。 1.1.1 关键在于字符的编码转换,必须把xml统一编码为utf8才能正确显示出来...
阅读全文
摘要:在win32file 模块里面有个GetDiskFreeSpace函数,可以方便的实现这一点,但是要注意,我们要先下载pywin32,否则在运行以下代码的时候会报:ImportError: No module named win32file另外好像必须在Python2.6以上的版本才行。 import win32file sectorsPerCluster, bytesPerSector, nu...
阅读全文
摘要: 在买书这方面,我自己很热衷,但我发现我厉害的是:我可以忽悠一堆同事用我的账号去买书。这样从一个普通的会员已经升级为钻石卡会员。 在其中的某个时间,我发现了返利网,使用了一段时间,发现在跟踪订单上很有问题,明明下了订单总是找不到,后来想也犯不着为这点返利折腾,就放弃了。 今天突然发现...
阅读全文