【Python】urllib模块_url编解码 ,编码格式类似“%xxxx”

 urlencode()、quote()、unquote()

urlencode 的参数是词典,它可以将key-value这样的键值对转换成我们想要的格式

urlencode 对字典或由两元素元组组成的列表进行码编码,将其转换为符合url规范的查询字符串

 

s = {"name":  "zhangsan"}
print(urllib.parse.urlencode(s))

 

执行结果

 

 

 

quote()  对string进行编码(只对一个字符串进行urlencode转换)

quote 对非ASCII编码的字符进行编码,默认进行UTF-8编码,不对“/”进行编码;(,errors=‘strict’(如果不能对string进行编码,rasie 引发一个 UnicodeEncodeErrort 错误))
一般对请求url路径中非ASCII编码的字符(string)进行编码

url 请求链接不能包含非ASCII编码的字符,非ASCII编码的字符被认为是不安全的,所以进行编码。
safe = “/”,说明“/”是安全的,不用进行编码.。
url 中保留的字符:在url 中都认为是安全的可以不进行编码,safe包含的字符都不会被编码。

注意:dict格式转换为dict 编码与字符串编码不一致

a = {"name":"zhangsan"}
b = quote(str(a))
c = '{"name":"zhangsan"}'
d = quote(c)

print(a)
print(b)
print(c)
print(d)

 

运行结果

 

java中标准url编码 空格为+

python中 quote_plus 将空格编码为 +, quote 将空格编码为 %20

 示例

# -*- coding:utf-8 -*-
import json
import urllib.parse

if __name__ == "__main__":
    text = {"name": "zhansan", "addr": "beijing", "remark": "备注"}
    text = json.dumps(text, ensure_ascii=False)
    print("quote 编码:", urllib.parse.quote(text))
    print("quote_plus 编码:", urllib.parse.quote_plus(text))

 

执行结果

 

 

unquote()   对url进行解码,把类似"%xx"的字符替换成单个字符

 

data_dict = {"name": "wangjia", "address": "北京市西城区", "url": "https://www.baidu.com"}

undata_dict = "%7B%27name%27%3A%20%27wangjia%27%2C%20%27address%27%3A%20%27%E5%8C%97%E4%BA%AC%E5%B8%82%E8%A5%BF%E5%9F%8E%E5%8C%BA%27%2C%20%27url%27%3A%20%27https%3A//www.baidu.com%27%7D"

# 对url进行编码
data_q = urllib.parse.quote(str(data_dict))
print("编码:", data_q)

# 对url进行解码
unresult = urllib.parse.unquote(undata_dict)
print("解码: ", unresult)

# 将URL中的键值对以连接符&划分
key_value_data = urllib.parse.urlencode(data_dict)
print("编码:", key_value_data)

 

编码: %7B%27name%27%3A%20%27wangjia%27%2C%20%27address%27%3A%20%27%E5%8C%97%E4%BA%AC%E5%B8%82%E8%A5%BF%E5%9F%8E%E5%8C%BA%27%2C%20%27url%27%3A%20%27https%3A//www.baidu.com%27%7D
解码: {'name': 'wangjia', 'address': '北京市西城区', 'url': 'https://www.baidu.com'}
编码: name=wangjia&address=%E5%8C%97%E4%BA%AC%E5%B8%82%E8%A5%BF%E5%9F%8E%E5%8C%BA&url=https%3A%2F%2Fwww.baidu.com

进程已结束,退出代码为 0

 

 

 

 


 

拓展:from urllib.parse import urlparse, urlsplit

  urlparse() 

      可以将 URL 解析成 ParseResult 对象。对象中包含了六个元素

 

  urlsplit() 

 

       urlsplit() 函数也能对 URL 进行拆分,urlsplit() 并不会把 路径参数(params) 从 路径(path) 中分离出来。在不能使用urlparse()时 使用此函数。

 

posted @ 2022-01-11 14:29  Phoenixy  阅读(530)  评论(0编辑  收藏  举报