[python]网络编程基础学习笔记(二)Web客户端访问
主要讨论python中urllib2模块,Http是urllib2中最常用的模块
使用urllib2做以下事情:
- 下载web页面
-在远程Http服务器上验证
-提交表单(form)数据
-处理错误
-与非Http协议通信
(一)获取Web页面
import sys, urllib2 req = urllib2.Request(sys.argv[1]) fd = urllib2.urlopen(req) while 1: data = fd.read(1024) if not len(data): break sys.stdout.write(data)
第一件事要建立一个urllib2.Request对象,该对象用URL作为参数
调用urlopen()函数,对象req被传进来,就有了一个文件类对象
(二)认证
有些站点需要Http认证之后才可以访问,最普通的认证类型是基本认证,由客户端向服务器发送一个用户名和密码。