对多次编码的字符串进行解码。

　　在公司最近的项目中，碰到一些非常讨厌的问题，主要是因为以前公司对搜索关键字进行了二次编码，而服务器在回传参数的时候又没有进行相应的处理，导致某些参数在客户端和服务器端来回传递的时候，编码越来越乱。

　　于是在网上搜了很多关于编码方面的问题，收获很多，（可以参照这篇文章）就突发奇想想做一个能对多次进行了编码的字符串进行解码的方法，下面是大致编码：

/**
    * decode keyword
    * @param {String} value 
    * @return {String} decoded value
    * */
    decode: function (value) {
		
		
		/**
		 * 针对escape、encodeURI、encodeURIComponent三种编码方式，根据其编码特征来处理
		 * 
		 * 1、escape，特征最为明显，对于值小与255的字符编码格式为%[a-zA-Z0-9]{2}，对值大于255的字符编码格式为%u[a-zA-Z0-9]{4}，
		 * 	  escape不进行编码的字符有69个： *，+，-，.，/，@，_，0-9，a-z，A-Z
		 * 2、encodeURI，编码格式为%[a-zA-Z0-9]{2},
		 * 	  encodeURI不进行编码的字符有82个：!，#，$，&，'，(，)，*，+，,，-，.，/，:，;，=，?，@，_，~，0-9，a-z，A-Z
		 * 3、encodeURIComponent三种编码方式，编码格式为%[a-zA-Z0-9]{2},
		 * 	  encodeURIComponent不进行编码的字符有71个：!， '，(，)，*，-，.，_，~，0-9，a-z，A-Z
		 * 
		 * 提取三种编码方式不同的部分：
		 * 当字符的值小于255时，三种编码方式结果相同，可以任意使用一种解码方式
		 * 当字符的值大于255时，escape编码的结果与另外两者不同，可根据其编码特征来处理，
		 * 即当编码格式为%u[a-zA-Z0-9]{4}时，使用unescape解码，
		 * 当编码格式为%[a-zA-Z0-9]{2}时，因为encodeURIComponent不进行编码的字符少于encodeURI，
		 * 则可判断decodeURIComponent可以同时针对encodeURI和因为encodeURIComponent两种编码方式进行解码
		 * 
		 * 记录解码结果，如果解码后与原字符串相同，则结束递归
		 */
		
        var ov = value, nv;		
        //if (/^((%u[a-zA-Z0-9]{4})|(%[a-zA-Z0-9]{2})|([\*\+-\./@_0-9a-zA-Z]*))*$/ig.test(ov)) nv = unescape(ov);
		if(/(%u[a-zA-Z0-9]{4}/ig.test(ov)) nv= unescape(ov);
        else if (/^((%[a-zA-Z0-9]{2})|([!#\$&'\(\)\*\+,-\./:;=\?@_~a-zA-Z0-9]))*$/ig.test(ov)) nv = decodeURIComponent(ov);
        else nv = ov;
        if (ov != nv) return this.decode(nv);
        else return nv;
    },

posted on 2011-03-18 15:37 56707801 阅读(618) 评论(2) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

一沙

对多次编码的字符串进行解码。

导航

公告