摘要: 简介: 原网址:黑板客爬虫闯关 提供给网友的一个学习爬虫的网站,关卡设计由易到难,到后面逐渐涉及模拟登陆,多线程等,让你掌握网络爬虫的基本技术。 第一关: 简单的在网址后面输入数字就可以,只不过你需要N++++个数字才能到达第二关的入口,每次跳转页面里都有下一个页面的跳转数字。所以这里需要用爬虫爬取 阅读全文
posted @ 2017-01-02 23:04 Freecode# 阅读(790) 评论(0) 推荐(0) 编辑
摘要: 1、python程序部署到sae上需要做的改动 在线上需要转换成wsgi的形式运行python程序。 sae中运行python程序需要指定一个函数为入口函数。 main函数是你定义的入口函数,在这里面你可以调用你定义的其它函数。 sae.create_wsgi_app(main) 创建main为入口 阅读全文
posted @ 2017-01-02 23:02 Freecode# 阅读(2600) 评论(0) 推荐(0) 编辑
摘要: 该博文主要适应于python2.7,并没有对py3进行测试。 主要记录学习python过程中容易出现的一些小问题、小错误,相信能给你启发。 1、剔除一个字符串中的所有空格(假设该字符串是s) "".join(s.split()) 样例输入: s = ' 123 4567 8 ' 样例输出: '123 阅读全文
posted @ 2017-01-02 23:01 Freecode# 阅读(1081) 评论(0) 推荐(0) 编辑
摘要: python2.x 中中间编码为unicode,一个字符串需要decode为unicode,再encode为其它编码格式(gbk、utf8等) 以gbk转utf8为例: 具体过程为: s | gbk decode('gbk') > s | unicode encode('utf8') > s | u 阅读全文
posted @ 2017-01-02 22:59 Freecode# 阅读(1811) 评论(0) 推荐(0) 编辑
摘要: 而通过转义序列设置终端显示属性的格式为: 其中转义序列以 \033[ 为开头,m 为设置属性结束,中间部分的 Param 为属性值,{} 表示可以设置多个属性,属性值之间通过分号 ; 隔离。 详情见:Python 3 实现简易 Shell Freecode# : www.cnblogs.com/yy 阅读全文
posted @ 2017-01-02 22:53 Freecode# 阅读(1421) 评论(0) 推荐(0) 编辑
摘要: 发现一个问题。 python中list变量作为全局变量时,在函数中可以直接修改。 而普通变量则需要先在函数中global声明,否则会报错。 例如: a = 1 def fun(): global a a = 2 而list: b = [1,2] def fun(): b[0] = 2 在函数中直接修 阅读全文
posted @ 2017-01-02 22:53 Freecode# 阅读(24103) 评论(0) 推荐(2) 编辑
摘要: 随便说两句 前两天写了一个python脚本,试图以分析网页源码的方式得到优酷视频的下载地址,结果只得到视频的纯播放地址,下载纯播放地址得到的文件也无法正常播放视频。 这里共享一下播放地址得到的方法(想看的可以展开折叠): # 实验视频地址:http://v.youku.com/v_show/id_X 阅读全文
posted @ 2017-01-02 22:51 Freecode# 阅读(13930) 评论(2) 推荐(0) 编辑