url编码本质
url编码本质
其实url本质就是将中文字符串进行utf8编码
,然后得到编码后的对象转换字符串去掉开头的b'
以及末尾的'
,然后再将\x
转换成%
,再将里面内容x
变成e
最后将字符串小写
变成大写
举例
#拿我举例
#第一步进行编码
a= '我'
a= a.encode('utf8')
#第二步进行转字符串去除头尾
a = str(a).strip("b'") #strip里面的值不是匹配而是有无
#第三步将\转换成%
a = a.replace('\\','%')
#第四部将x写变成e
a = a.replace('x','e')
#第五步将小写变成大写
a = a.upper()
#一步到位
a=str(a.encode('utf8')).strip("b'").replace('\\x','%').replace('x','e').upper()
#结果%E6%88%91
#不行你可以访问 https://www.baidu.com/s?wd=%E6%88%91,https://www.baidu.com/s?wd=我
#看看是不是一样
python中调用库进行url编码和解码
from urllib import parse
编码
str1 = '我'
str2 = parse.quote(str1)
print(str2)
#%E6%88%91
解码
str1 = '%E6%88%91'
str2 = parse.unquote(str1)
print(str2)
#我