摘要: 转载请注明:@小五义http://www.cnblogs.com/xiaowuyi6.1 最简单的爬虫网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。python的urllib\urllib2等模块很容易实现这一功能,下面的例子实现的是对baidu首页的下载。具体代码如下:import urllib2page=urllib2.urlopen("http://www.baidu.com")print page.read()6.2 提交表单数据(1)用GET方法提交数据提交表单的GET方法是把表单数据编码至URL。在给出请示的页面后,加上 阅读全文
posted @ 2012-09-18 16:48 小五义 阅读(8843) 评论(3) 推荐(2) 编辑