初学爬虫:爬取翻译网站

from urllib import request, parse
import json, re

url = "https://fanyi.baidu.com/sug"
# 对post请求携带的参数进行处理
# 1.将请求参数封装到字典中
while 1:
    word = input("输入中文:")
    data = {
        "kw": word
    }
    # 2.使用parse模块中的urlencode(返回值类型为字符串)进行编码处理
    data = parse.urlencode(data)
    # 3.降第二步获取编码结果转换成byte类型
    data = data.encode()

    # 发起post请求
    response = request.urlopen(url=url, data=data)
    res = json.loads(response.read())
    res = res['data'][0]['v']
    print(res)
    ret = re.findall("[A-Za-z]+;", res)
    print(ret[0])

 

posted @ 2019-01-25 20:10  Nope!!!!  阅读(429)  评论(0编辑  收藏  举报