【整理】js、python、java分别对url进行编码和解码

*** 只有 0-9[a-Z] $ - _ . + ! * ' ( ) , 以及某些保留字，才能不经过编码直接用于 URL。

***例如：搜索的中文关键字，复制网址之后再粘贴就会发现该URL已经被转码。

1、escape 和 unescape

原理：对除ASCII字母、数字、标点符号 @ * _ + - . / 以外的其他字符进行编码。

编码：escape('http://www.baidu.com?name=zhang@xiao@jie&order=1')

　　　结果："http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"

　　　escape('张')

　　　结果："%u5F20"

解码：unescape("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")

　　　结果："http://www.baidu.com?name=zhang@xiao@jie&order=1"

　　　unescape("%u5F20")

　　　结果："张"

2、encodeURI 和 decodeURI

原理：返回编码为有效的统一资源标识符 (URI) 的字符串，不会被编码的字符：! @ # $ & * ( ) = : / ; ? + '

　　 encodeURI()是Javascript中真正用来对URL编码的函数。

编码：encodeURI('http://www.baidu.com?name=zhang@xiao@jie&order=1')

　　　结果："http://www.baidu.com?name=zhang@xiao@jie&order=1"

解码：decodeURI("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")

　　　结果："http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"

【推荐】3、encodeURIComponent 和 decodeURIComponent

原理：对URL的组成部分进行个别编码，而不用于对整个URL进行编码

编码：encodeURIComponent('http://www.baidu.com?name=zhang@xiao@jie&order=1')

　　　结果："http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1"

解码：decodeURIComponent("http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1")

　　　"http://www.baidu.com?name=zhang@xiao@jie&order=1"

原文：https://www.cnblogs.com/z-one/p/6542955.html

补充：python方式（编码、解码）

python2解码

print urllib.unquote("%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0")

python3解码

# py3解码
import urllib.parse
rawurl = "https://www.baidu.com/s?wd=%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0"
res = urllib.parse.unquote(rawurl)
print(res)

https://www.baidu.com/s?wd=全栈测试笔记

python编码

# py3编码
res = urllib.parse.quote("全栈测试笔记")
print(res)

%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0　

URL为何要编码、解码？

通常如果一样东西需要编码，说明这样东西并不适合传输。原因多种多样，如Size过大，包含隐私数据。对于Url来说，之所以要进行编码，是因为Url中有些字符会引起歧义。

例如，Url参数字符串中使用key=value键值对这样的形式来传参，键值对之间以&符号分隔，如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&，那么势必会造成接收Url的服务器解析错误，因此必须将引起歧义的&和=符号进行转义，也就是对其进行编码。

又如，Url的编码格式采用的是ASCII码，而不是Unicode，这也就是说你不能在Url中包含任何非ASCII字符，例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下，中文可能会造成问题。

参考：https://www.cnblogs.com/kaituorensheng/p/3927000.html

补充：java方式（编码、解码）

package com.qzcsbj.demo;

import java.io.UnsupportedEncodingException;

/**
 * @motto : 将来的你定会感谢现在拼命努力的自己。
 * @create : 2021-08-17 22:07
 * @description : <描述>
 * @博客 : www.cnblogs.com/uncleyong
 * @公众号 : 全栈测试笔记
 * @作者微信: ren168632201
 */
public class T {
    private final static String ENCODE = "GBK";

    public static void main(String[] args) {
        String str1 = "http://www.baidu.com/s?wd=全栈测试笔记";
        String str2 = "http%3A%2F%2Fwww.baidu.com%2Fs%3Fwd%3D%C8%AB%D5%BB%B2%E2%CA%D4%B1%CA%BC%C7";
        System.out.println(getURLEncoderString(str1));
        System.out.println(getURLDecoderString(str2));
    }

    public static String getURLDecoderString(String str) {
        String result = "";
        if (null == str) {
            return "";
        }
        try {
            result = java.net.URLDecoder.decode(str, ENCODE);
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return result;
    }

    public static String getURLEncoderString(String str) {
        String result = "";
        if (null == str) {
            return "";
        }
        try {
            result = java.net.URLEncoder.encode(str, ENCODE);
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return result;
    }

}

posted @ 2021-08-17 12:02 全栈测试笔记阅读(902) 评论(0) 收藏举报

刷新页面返回顶部

全栈测试笔记

热爱技术，擅长性能、自动化、持续集成、测开、质量管理、AI测试应用等。
博客分享的技术热门主流、通俗易懂、简单实用，工作中能实操落地。

【整理】js、python、java分别对url进行编码和解码

1、escape 和 unescape

2、encodeURI 和 decodeURI

【推荐】3、encodeURIComponent 和 decodeURIComponent

补充：python方式（编码、解码）

python2解码

python3解码

python编码

URL为何要编码、解码？

补充：java方式（编码、解码）

公告

全栈测试笔记

热爱技术，擅长性能、自动化、持续集成、测开、质量管理、AI测试应用等。 博客分享的技术热门主流、通俗易懂、简单实用，工作中能实操落地。

【整理】js、python、java分别对url进行编码和解码

1、escape 和 unescape

2、encodeURI 和 decodeURI

【推荐】3、encodeURIComponent 和 decodeURIComponent

补充：python方式（编码、解码）

python2解码

python3解码

python编码

URL为何要编码、解码？

补充：java方式（编码、解码）

公告

热爱技术，擅长性能、自动化、持续集成、测开、质量管理、AI测试应用等。
博客分享的技术热门主流、通俗易懂、简单实用，工作中能实操落地。