遇一山,过一山,处处有风景;只要勇敢向前,一路尽是繁花盛开。 | (点击查看→)【测试干货】python/java自动化、持续集成、性能、测开、简历、笔试面试等

【整理】js、python、java分别对url进行编码和解码

*** 只有 0-9[a-Z] $ - _ . + ! * ' ( ) , 以及某些保留字,才能不经过编码直接用于 URL。

***例如:搜索的中文关键字,复制网址之后再粘贴就会发现该URL已经被转码。

1、escape 和 unescape

原理:对除ASCII字母、数字、标点符号 @  *  _  +  -  .  / 以外的其他字符进行编码。

编码:escape('http://www.baidu.com?name=zhang@xiao@jie&order=1')

   结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"

   escape('张')

   结果:"%u5F20"

解码:unescape("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")

   结果:"http://www.baidu.com?name=zhang@xiao@jie&order=1"

   unescape("%u5F20")

   结果:"张"

2、encodeURI 和 decodeURI

原理:返回编码为有效的统一资源标识符 (URI) 的字符串,不会被编码的字符:! @ # $ & * ( ) = : / ; ? + '

     encodeURI()是Javascript中真正用来对URL编码的函数。

编码:encodeURI('http://www.baidu.com?name=zhang@xiao@jie&order=1')

   结果:"http://www.baidu.com?name=zhang@xiao@jie&order=1"

解码:decodeURI("http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1")

   结果:"http%3A//www.baidu.com%3Fname%3Dzhang@xiao@jie%26order%3D1"

【推荐】3、encodeURIComponent 和 decodeURIComponent

原理:对URL的组成部分进行个别编码,而不用于对整个URL进行编码

编码:encodeURIComponent('http://www.baidu.com?name=zhang@xiao@jie&order=1')

   结果:"http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1"

解码:decodeURIComponent("http%3A%2F%2Fwww.baidu.com%3Fname%3Dzhang%40xiao%40jie%26order%3D1")

   "http://www.baidu.com?name=zhang@xiao@jie&order=1"

 

原文:https://www.cnblogs.com/z-one/p/6542955.html

 

补充:python方式(编码、解码)

python2解码

print urllib.unquote("%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0")

python3解码

# py3解码
import urllib.parse
rawurl = "https://www.baidu.com/s?wd=%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0"
res = urllib.parse.unquote(rawurl)
print(res)

https://www.baidu.com/s?wd=全栈测试笔记

python编码

# py3编码
res = urllib.parse.quote("全栈测试笔记")
print(res)

%E5%85%A8%E6%A0%88%E6%B5%8B%E8%AF%95%E7%AC%94%E8%AE%B0 

 

URL为何要编码、解码?

    通常如果一样东西需要编码,说明这样东西并不适合传输。原因多种多样,如Size过大,包含隐私数据。对于Url来说,之所以要进行编码,是因为Url中有些字符会引起歧义。

    例如,Url参数字符串中使用key=value键值对这样的形式来传参,键值对之间以&符号分隔,如/s?q=abc&ie=utf-8。如果你的value字符串中包含了=或者&,那么势必会造成接收Url的服务器解析错误,因此必须将引起歧义的&和=符号进行转义,也就是对其进行编码。

    又如,Url的编码格式采用的是ASCII码,而不是Unicode,这也就是说你不能在Url中包含任何非ASCII字符,例如中文。否则如果客户端浏览器和服务端浏览器支持的字符集不同的情况下,中文可能会造成问题。

参考:https://www.cnblogs.com/kaituorensheng/p/3927000.html

 

补充:java方式(编码、解码)

package com.qzcsbj.demo;

import java.io.UnsupportedEncodingException;

/**
 * @motto : 将来的你定会感谢现在拼命努力的自己。
 * @create : 2021-08-17 22:07
 * @description : <描述>
 * @博客 : www.cnblogs.com/uncleyong
 * @公众号 : 全栈测试笔记
 * @作者微信: ren168632201
 */
public class T {
    private final static String ENCODE = "GBK";

    public static void main(String[] args) {
        String str1 = "http://www.baidu.com/s?wd=全栈测试笔记";
        String str2 = "http%3A%2F%2Fwww.baidu.com%2Fs%3Fwd%3D%C8%AB%D5%BB%B2%E2%CA%D4%B1%CA%BC%C7";
        System.out.println(getURLEncoderString(str1));
        System.out.println(getURLDecoderString(str2));
    }

    public static String getURLDecoderString(String str) {
        String result = "";
        if (null == str) {
            return "";
        }
        try {
            result = java.net.URLDecoder.decode(str, ENCODE);
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return result;
    }

    public static String getURLEncoderString(String str) {
        String result = "";
        if (null == str) {
            return "";
        }
        try {
            result = java.net.URLEncoder.encode(str, ENCODE);
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return result;
    }

}

  

 

posted @ 2021-08-17 12:02  全栈测试笔记  阅读(739)  评论(0编辑  收藏  举报
浏览器标题切换
浏览器标题切换end