摘要:
数模有一个题目要处理杭州自行车在每个站点可用数量和已经借出数量,这数据在www.hzbus.cn上可以获取,它是10分钟更新一次的。这些数据手动获取,需要不停的刷页面,从6:00am到9:00pm,显然不可取。过程:先用Chrome抓包,找到了相应数据的页面URL,然后写个脚本把此URL的html代码,并且设置计时器,保存到本地;分析html代码,获得数据所在处的特点,然后写个脚本提取它们,并保存到指定文件中.具体:1.抓包就掠过吧,Chrome还是有很多开发人员应该掌握的工具的2.找到URL页面后,发现Python有现成代码可用(urllib2),保存到本地就很方便代码:import url 阅读全文
摘要:
当谷歌停止Google Reader后,我开始玩RSS Reader了。网上大抵说Google Reader的退出很可惜,不过替代品还是存在的。作为一个newbie我的视野或许很局限不过还是说几点:1.什么是RSS?RSS就是Really Simple Syndication,我翻译为“非常简单的阅读方式”,因为就算是普通的netizen一枚,时间久了也会把自己和n多的话题链接起来,这就导致我们每天都要看非常多的页面,会感到不知所措。RSS的方式相当于提供了一个Reading方面的RSS,也可以理解为现实世界各种通知的公告板一样的地方,而且是可以自行定制的(这又有点像免费杂志。。。)可以先去看 阅读全文
摘要:
这其实才是真正的linux,恰当使用权限。网上找到的中文博客,基本上就那么几篇原创,都要编译源码。但89服务器性能太差编译一次大约半小时无法忍受,在本机上创建了standard用户去尝试几篇博客所言,编译倒是没问题但后面的配置都不对。详细说吧。http://www.cnblogs.com/karotte/archive/2012/08/12/install_lamp.html《无root权限部署LAMP环境》。乍一看有图有真相很高端有说服力,但错误不少,比如mysql_install.sh这个自行编写的configure中把ENGINE写成ENGING;把所有步骤原样照搬,发现配置那里总搞不定 阅读全文