冬西

导航

爬虫1

import urllib.request

import urllib.parse

import string

url = "http://www.baidu.com/s?wd="

name="中文"

#python urllib库 不支持中文 必须将中文转换成 ascii 不然会报错 这也是初学者的一个大坑

encode_name = urllib.parse.quote(name,safe = string.printable)

#url地址拼接 

final_url = url + encode_name

#目标网页请求 https 是需要有请求头的 这里用http 请求

response = urllib.urlopen(final_url)

#解读 并转化成 utf-8

data = response.read().decode("utf-8")

#这样我们就获得了目标网站的信息了

#如果name为字典 我们先要将name转化一下

str_name = urllib.parse.urlencode(name)

#然后如果有中文再转换中文 没中文直接拼接url就成

str_dict = urllib.parse.urlencode(dict)

posted on 2019-07-26 10:07  冬西  阅读(92)  评论(0编辑  收藏  举报