爬虫1
import urllib.request
import urllib.parse
import string
url = "http://www.baidu.com/s?wd="
name="中文"
#python urllib库 不支持中文 必须将中文转换成 ascii 不然会报错 这也是初学者的一个大坑
encode_name = urllib.parse.quote(name,safe = string.printable)
#url地址拼接
final_url = url + encode_name
#目标网页请求 https 是需要有请求头的 这里用http 请求
response = urllib.urlopen(final_url)
#解读 并转化成 utf-8
data = response.read().decode("utf-8")
#这样我们就获得了目标网站的信息了
#如果name为字典 我们先要将name转化一下
str_name = urllib.parse.urlencode(name)
#然后如果有中文再转换中文 没中文直接拼接url就成
str_dict = urllib.parse.urlencode(dict)