爬虫1

import urllib.request

import urllib.parse

import string

url = "http://www.baidu.com/s?wd="

name="中文"

#python urllib库不支持中文必须将中文转换成 ascii 不然会报错这也是初学者的一个大坑

encode_name = urllib.parse.quote(name,safe = string.printable)

#url地址拼接

final_url = url + encode_name

#目标网页请求 https 是需要有请求头的这里用http 请求

response = urllib.urlopen(final_url)

#解读并转化成 utf-8

data = response.read().decode("utf-8")

#这样我们就获得了目标网站的信息了

#如果name为字典我们先要将name转化一下

str_name = urllib.parse.urlencode(name)

#然后如果有中文再转换中文没中文直接拼接url就成

str_dict = urllib.parse.urlencode(dict)

posted on 2019-07-26 10:07 冬西阅读(105) 评论(0) 收藏举报

刷新页面返回顶部

冬西