摘要: 亲爱的朋友:欢迎你!很高兴能在这里见到你,你能来到这里说明你真的很喜欢python,很想把python给学好!我觉的你很幸运,开始我学python的时候比较少资料,学起来也比较头疼,现在随着python越来越流行, 资料也越来越多,大家以后学起来应该会轻松很多了。我前段时间花了很多时间整理了一些py... 阅读全文
posted @ 2014-11-06 16:20 GisClub 阅读(375) 评论(0) 推荐(0) 编辑
摘要: 对于大部分论坛,我们想要抓取其中的帖子分析,首先需要登录,否则无法查看。 这是因为 HTTP 协议是一个无状态(Stateless)的协议,服务器如何知道当前请求连接的用户是否已经登录了呢?有两种方式:在URI 中显式地使用 Session ID;利用 Cookie,大概过程是登录一个网站后会在... 阅读全文
posted @ 2014-11-06 16:17 GisClub 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过 Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开 位于本地和Web上的H... 阅读全文
posted @ 2014-11-06 16:14 GisClub 阅读(426) 评论(0) 推荐(0) 编辑
摘要: 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python 语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首 先,我们介... 阅读全文
posted @ 2014-11-06 16:06 GisClub 阅读(710) 评论(0) 推荐(0) 编辑
摘要: import urllib.request as requestimport urllib.parse as parseimport stringprint("""+++++++++++++++++++++++ 数据挖掘哪家强? 北京朝阳找龙道!+++++++++++++++++=++++ ... 阅读全文
posted @ 2014-11-06 16:00 GisClub 阅读(219) 评论(0) 推荐(0) 编辑