随笔分类 - Python 爬虫
摘要:每次进uva都慢的要死,而且一步一步找到自己的那个题目简直要命。 于是,我想到做一个爬取uva题库,记录一下其中遇到的问题。 1、uva题目的链接是一个外部的,想要获取https资源,会报出SNIMissingWarning和InsecurePlatformWarning警告。 老实说,我一个单词都
阅读全文
摘要:糗事百科网站段子爬取,糗事百科是我见过的最简单的网站了!!!
阅读全文
摘要:参考资料:http://cuiqingcai.com/947.html urllib,urlib2是python自带的库. urlopen(url,data,timeout),三个参数。 第一个是地址,第二个是传入数据,有Post方式,Get方式,第三个是超时访问时间 urlopen()函数返回一个
阅读全文
摘要:主要是正则表达式不熟练,基础知识不扎实,函数也不怎么会用,下次再深入了解这3个函数吧。 主要是一个翻页的功能,其实,就是通过一个url替换一下数字,然后得到一个新的url,再找这个新的链接的信息。
阅读全文
摘要:学了两天python,语法慢慢熟悉吧,数据结构都没写过。 写了一个爬图片的小东西。挺有意思的。都是女神照 (✿◡‿◡) 用的是正则表达式, requests的导入,我也是醉了,还要easy_install,pip, 后来一切准备就绪了,浏览器打开的源码http:\/,都是这种鬼东西,我就用word替
阅读全文
摘要:之所以学习Python,第一个是他比较简单,寒假时间充裕,而且听说功能也很不错,最重要的是,我今年的项目就要用到它。 而且刘汝佳的书上说到,一个好的Acmer要是不会一点Python那就是太可惜了。废话不说,看看第一天的学习内容! 如何编写Python1、cmd下输入python就可以进入开发模式2
阅读全文