【整理】js、python、java分别对url进行编码和解码
*** 只有 0-9[a-Z] $ - _ . + ! * ' ( ) , 以及某些保留字,才能不经过编码直接用于 URL。
***例如:搜索的中文关键字,复制网址之后再粘贴就会发现该URL已经被转码。
1、escape 和 unescape
原理:对除ASCII字母、数字、标点符号 @ * _ + - . / 以外的其他字符进行编码。
编码:escape('http://www.baidu.com?name=zhang@xiao@jie&order=1')
结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"
escape('张')
结果:"%u5F20"
解码:unescape("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")
结果:"http://www.baidu.com?name=zhang@xiao@jie&order=1"
unescape("%u5F20")
结果:"张"
2、encodeURI 和 decodeURI
原理:返回编码为有效的统一资源标识符 (URI) 的字符串,不会被编码的字符:! @ # $ & * ( ) = : / ; ? + '
encodeURI()是Javascript中真正用来对URL编码的函数。
编码:encodeURI('http://www.baidu.com?name=zhang@xiao@jie&order=1')
结果:"http://www.baidu.com?name=zhang@xiao@jie&order=1"
解码:decodeURI("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")
结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"
【推荐】3、encodeURIComponent 和 decodeURIComponent
原理:对URL的组成部分进行个别编码,而不用于对整个URL进行编码
编码:encodeURIComponent('http://www.baidu.com?name=zhang@xiao@jie&order=1')
结果:"http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1"
解码:decodeURIComponent("http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1")
"http://www.baidu.com?name=zhang@xiao@jie&order=1"
原文:https://www.cnblogs.com/z-one/p/6542955.html
补充:python方式(编码、解码)
python2解码
print urllib.unquote("%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0")
python3解码
# py3解码 import urllib.parse rawurl = "https://www.baidu.com/s?wd=%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0" res = urllib.parse.unquote(rawurl) print(res)
https://www.baidu.com/s?wd=全栈测试笔记
python编码
# py3编码 res = urllib.parse.quote("全栈测试笔记") print(res)
%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0
URL为何要编码、解码?
通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据。对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。
例如,Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。
又如,Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url中包含任何非ASCII字符,例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。
参考:https://www.cnblogs.com/kaituorensheng/p/3927000.html
补充:java方式(编码、解码)
package com.qzcsbj.demo; import java.io.UnsupportedEncodingException; /** * @motto : 将来的你定会感谢现在拼命努力的自己。 * @create : 2021-08-17 22:07 * @description : <描述> * @博客 : www.cnblogs.com/uncleyong * @公众号 : 全栈测试笔记 * @作者微信: ren168632201 */ public class T { private final static String ENCODE = "GBK"; public static void main(String[] args) { String str1 = "http://www.baidu.com/s?wd=全栈测试笔记"; String str2 = "http%3A%2F%2Fwww.baidu.com%2Fs%3Fwd%3D%C8%AB%D5%BB%B2%E2%CA%D4%B1%CA%BC%C7"; System.out.println(getURLEncoderString(str1)); System.out.println(getURLDecoderString(str2)); } public static String getURLDecoderString(String str) { String result = ""; if (null == str) { return ""; } try { result = java.net.URLDecoder.decode(str, ENCODE); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } return result; } public static String getURLEncoderString(String str) { String result = ""; if (null == str) { return ""; } try { result = java.net.URLEncoder.encode(str, ENCODE); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } return result; } }
__EOF__
关于博主:擅长性能、全链路、自动化、企业级自动化持续集成(DevTestOps)、测开等
面试必备:项目实战(性能、自动化)、简历笔试,https://www.cnblogs.com/uncleyong/p/15777706.html
测试提升:从测试小白到高级测试修炼之路,https://www.cnblogs.com/uncleyong/p/10530261.html
欢迎分享:如果您觉得文章对您有帮助,欢迎转载、分享,也可以点击文章右下角【推荐】一下!