【Python】urllib模块_url编解码，编码格式类似“%xxxx”

urlencode()、quote()、unquote()

urlencode 的参数是词典，它可以将key-value这样的键值对转换成我们想要的格式

urlencode 对字典或由两元素元组组成的列表进行码编码，将其转换为符合url规范的查询字符串

s = {"name":  "zhangsan"}
print(urllib.parse.urlencode(s))

执行结果

quote() 对string进行编码（只对一个字符串进行urlencode转换）

quote 对非ASCII编码的字符进行编码，默认进行UTF-8编码，不对“/”进行编码；（,errors=‘strict’(如果不能对string进行编码，rasie 引发一个 UnicodeEncodeErrort 错误)）
一般对请求url路径中非ASCII编码的字符(string)进行编码

url 请求链接不能包含非ASCII编码的字符，非ASCII编码的字符被认为是不安全的，所以进行编码。
safe = “/”,说明“/”是安全的，不用进行编码.。
url 中保留的字符：在url 中都认为是安全的可以不进行编码，safe包含的字符都不会被编码。

注意：dict格式转换为dict 编码与字符串编码不一致

a = {"name":"zhangsan"}
b = quote(str(a))
c = '{"name":"zhangsan"}'
d = quote(c)

print(a)
print(b)
print(c)
print(d)

运行结果

java中标准url编码空格为+

python中 quote_plus 将空格编码为 +， quote 将空格编码为 %20

示例

# -*- coding:utf-8 -*-
import json
import urllib.parse

if __name__ == "__main__":
    text = {"name": "zhansan", "addr": "beijing", "remark": "备注"}
    text = json.dumps(text, ensure_ascii=False)
    print("quote 编码:", urllib.parse.quote(text))
    print("quote_plus 编码:", urllib.parse.quote_plus(text))

执行结果

unquote() 对url进行解码，把类似"%xx"的字符替换成单个字符

data_dict = {"name": "wangjia", "address": "北京市西城区", "url": "https://www.baidu.com"}

undata_dict = "%7B%27name%27%3A%20%27wangjia%27%2C%20%27address%27%3A%20%27%E5%8C%97%E4%BA%AC%E5%B8%82%E8%A5%BF%E5%9F%8E%E5%8C%BA%27%2C%20%27url%27%3A%20%27https%3A//www.baidu.com%27%7D"

# 对url进行编码
data_q = urllib.parse.quote(str(data_dict))
print("编码：", data_q)

# 对url进行解码
unresult = urllib.parse.unquote(undata_dict)
print("解码： ", unresult)

# 将URL中的键值对以连接符&划分
key_value_data = urllib.parse.urlencode(data_dict)
print("编码：", key_value_data)

编码： %7B%27name%27%3A%20%27wangjia%27%2C%20%27address%27%3A%20%27%E5%8C%97%E4%BA%AC%E5%B8%82%E8%A5%BF%E5%9F%8E%E5%8C%BA%27%2C%20%27url%27%3A%20%27https%3A//www.baidu.com%27%7D
解码： {'name': 'wangjia', 'address': '北京市西城区', 'url': 'https://www.baidu.com'}
编码： name=wangjia&address=%E5%8C%97%E4%BA%AC%E5%B8%82%E8%A5%BF%E5%9F%8E%E5%8C%BA&url=https%3A%2F%2Fwww.baidu.com

进程已结束，退出代码为 0

拓展：from urllib.parse import urlparse, urlsplit

　　urlparse()

　　　　　　可以将 URL 解析成 ParseResult 对象。对象中包含了六个元素

　　urlsplit()

　　　　　　urlsplit() 函数也能对 URL 进行拆分，urlsplit() 并不会把路径参数(params) 从路径(path) 中分离出来。在不能使用urlparse()时使用此函数。

posted @ 2022-01-11 14:29 Phoenixy 阅读(649) 评论(0) 收藏举报

刷新页面返回顶部

【Python】urllib模块_url编解码 ，编码格式类似“%xxxx”

urlencode()、quote()、unquote()

拓展：from urllib.parse import urlparse, urlsplit

urlparse()

urlsplit()

公告

【Python】urllib模块_url编解码，编码格式类似“%xxxx”

　　urlparse()

　　urlsplit()