伪造请求头向url传递参数爬取百度默认翻译

from urllib import request,parse
import json

# 翻译函数
def fanyi(msg):

    #参数封装
    data = {
        "kw": content
    }

    #参数拼接以及转码
    data = parse.urlencode(data)

    #请求地址
    base_url = "http://fanyi.baidu.com/sug"

    # Post
    headers = {
        "Content-Length": len(data), #动态计算data长度
        "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36"
    }

    #封装一个request对象(地址,数据,headers)
    req = request.Request(url=base_url, data=bytes(data, encoding="utf-8"), headers=headers)

    #发起请求,并得到响应
    response = request.urlopen(req)

    #读取内容
    html = response.read()
    html = html.decode("utf-8") #转码

    json_data = json.loads(html)#使用json格式化
    #print(json_data)

    # 整理数据
    for item in json_data["data"]:
        print(item["k"], item["v"])

if __name__ == "__main__":
    #输入数据
    content = input("请输入您要翻译的内容:")

    #翻译
    fanyi(content)

 

posted @ 2018-03-10 21:23  Bob__Zhang  阅读(566)  评论(0编辑  收藏  举报