URLEncode

为什么请求时,需要使用URLEncode做encode转码操作?

发现现在几乎所有的网站都对url中的汉字和特殊的字符,进行了urlencode操作, 也就是:

http://hi.baidu.com/%BE%B2%D0%C4%C0%CF%C8%CB/creat/blog/

这个样子,中间%形式的,肯定就是我的登录用户名称了吧。

为什么对这些字符进行了u的编码形式,是为了字符编码(gbk、utf8)还是为了不出现特殊的字符在url中?都知道要转,但是转了的真正好处呢。查看了网上的很多资料,也没有找到更加准确的说法。

url转义其实也只是为了符合url的规范而已。因为在标准的url规范中中文和很多的字符是不允许出现在url中的。

那哪些字符是需要转化的呢?

  1. ASCII 的控制字符

这些字符都是不可打印的,自然需要进行转化。

  1. 一些非ASCII字符

这些字符自然是非法的字符范围。转化也是理所当然的了。

  1. 一些保留字符

很明显最常见的就是“&”了,这个如果出现在url中了,那你认为是url中的一个字符呢,还是特殊的参数分割用的呢?

  1. 就是一些不安全的字符了。

例如:空格。为了防止引起歧义,需要被转化为“+”。

明白了这些,也就知道了为什么需要转化了,而转化的规则也是很简单的。

按照每个字符对应的字符编码,不是符合我们范围的,统统的转化为%的形式也就是了。自然也是16进制的形式。

和字符编码无关

通过urlencode的转化规则和目的,我们也很容易的看出,urleocode是基于字符编码的。同样的一个汉字,不同的编码类型,肯定对应不同的urleocode的串。gbk编码的有gbk的encode结果。

apache等服务器,接受到字符串后,可以进行decode,但是还是无法解决编码的问题。编码问题,还是需要靠约定或者字符编码的判断解决。

因此,urleocode只是为了url中一些非ascii字符,可以正确无误的被传输,至于使用哪种编码,就不是eocode所关心和解决的问题了。

 

详细https://blog.csdn.net/u013833031/article/details/78828539

Java中转化

URLEncode和URLDecode用于完成普通字符串和 application/x-www-from-urlencoded MIME字符串之间的相互转化

如果传递的字符串中包含非西欧字符的字符串,会被转化成%XX%XX XX为十六进制的数字

try {
            // 将application/x-www-from-urlencoded字符串转换成普通字符串  
            String keyWord = URLDecoder.decode("%C4%E3%BA%C3", "GBK");  
            System.out.println(keyWord);  //输出你好
            // 将普通字符创转换成application/x-www-from-urlencoded字符串  
            String urlString = URLEncoder.encode("你好", "GBK");  //输出%C4%E3%BA%C3
 
            System.out.println(urlString);
        } catch (UnsupportedEncodingException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }  

 

URL特殊字符需转义 

1、空格换成加号(+) 
2、正斜杠(/)分隔目录和子目录 
3、问号(?)分隔URL和查询 
4、百分号(%)制定特殊字符 
5、#号指定书签 
6、&号分隔参数 

转义字符的原因: 

如果你的表单使用get方法提交,并且提交的参数中有“&”等特殊符的话,如果不做处理,在service端就会将&后面的作为另外一个参数来看待。例如 
表单的action为list.jsf?act=go&state=5 
则提交时通过request.getParameter可以分别取得act和state的值。 
如果你的本意是act='go&state=5'这个字符串,那么为了在服务端拿到act的准确值,你必须对&进行转义 

url转义字符原理: 

将这些特殊的字符转换成ASCII码,格式为:%加字符的ASCII码,即一个百分号%,后面跟对应字符的ASCII(16进制)码值。例如 空格的编码值是"%20"。 

URL特殊符号及对应的十六进制值编码: 

1. +  URL 中+号表示空格 %2B 
2. 空格 URL中的空格可以用+号或者编码 %20 
3. /  分隔目录和子目录 %2F  
4. ?  分隔实际的 URL 和参数 %3F  
5. % 指定特殊字符 %25  
6. # 表示书签 %23  
7. & URL 中指定的参数间的分隔符 %26  
8. = URL 中指定参数的值 %3D 

https://www.cnblogs.com/cdxkyz/p/3976167.html

posted @ 2019-12-02 22:50  从来没有平凡的时刻  阅读(7018)  评论(0编辑  收藏  举报