Base64编码

开发者对Base64编码肯定很熟悉,是否对它有很清晰的认识就不一定了。实际 上Base64已经简单到不能再简单了,如果对它的理解还是模棱两可实在不应该。大概介绍一下Base64的相关内容,花几分钟时间就可以彻底理解它。文 章下边贴了一个Base64的编解码器,方便阅读文章的同时来实验。

  一. Base64编码由来

  为什么会有Base64编码呢?因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就 不能通过邮件传送。这样用途就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情 况下,做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示,问题就解决了。Base64编码应运而生,Base64就是一种 基于64个可打印字符来表示二进制数据的表示方法。

  二. Base64编码原理

  看一下Base64的索引表,字符选用了"A-Z、a-z、0-9、+、/" 64个可打印字符。数值代表字符的索引,这个是标准Base64协议规定的,不能更改。64个字符用6个bit位就可以全部表示,一个字节有8个bit 位,剩下两个bit就浪费掉了,这样就不得不牺牲一部分空间了。这里需要弄明白的就是一个Base64字符是8个bit,但是有效部分只有右边的6个 bit,左边两个永远是0。

  那么怎么用6个有效bit来表示传统字符的8个bit呢?8和6的最小公倍数 是24,也就是说3个传统字节可以由4个Base64字符来表示,保证有效位数是一样的,这样就多了1/3的字节数来弥补Base64只有6个有效bit 的不足。你也可以说用两个Base64字符也能表示一个传统字符,但是采用最小公倍数的方案其实是最减少浪费的。结合下边的图比较容易理解。Man是三个 字符,一共24个有效bit,只好用4个Base64字符来凑齐24个有效位。红框表示的是对应的Base64,6个有效位转化成相应的索引值再对应 Base64字符表,查出"Man"对应的Base64字符是"TWFU"。说到这里有个原则不知道你发现了没有,要转换成Base64的最小单位就是三个字节,对一个字符串来说每次都是三个字节三个字节的转换,对应的是Base64的四个字节。这个搞清楚了其实就差不多了。

         

  但是转换到最后你发现不够三个字节了怎么办呢?愿望终于实现了,我们可以用两 个Base64来表示一个字符或用三个Base64表示两个字符,像下图的A对应的第二个Base64的二进制位只有两个,把后边的四个补0就是了。所以 A对应的Base64字符就是QQ。上边已经说过了,原则是Base64字符的最小单位是四个字符一组,那这才两个字 符,后边补两个"="吧。其实不用"="也不耽误解码,之所以用"=",可能是考虑到多段编码后的Base64字符串拼起来也不会引起混淆。由此可见 Base64字符串只可能最后出现一个或两个"=",中间是不可能出现"="的。下图中字符"BC"的编码过程也是一样的。

  三. 总结  

  说起Base64编码可能有些奇怪,因为大多数的编码都是由字符转化成二进制的过程,而从二进制转成字符的过程称为解码。而Base64的概念就恰好反了,由二进制转到字符称为编码,由字符到二进制称为解码。

  Base64编码主要用在传输、存储、表示二进制等领域,还可以用来加密,但是这种加密比较简单,只是一眼看上去不知道什么内容罢了,当然也可以对Base64的字符序列进行定制来进行加密。

  Base64编码是从二进制到字符的过程,像一些中文字符用不同的编码转为二 进制时,产生的二进制是不一样的,所以最终产生的Base64字符也不一样。例如"上网"对应utf-8格式的Base64编码是"5LiK572R", 对应GB2312格式的Base64编码是"yc/N+A=="。

来源:http://www.cnblogs.com/luguo3000/p/3940197.html

 

js实现

  1. var base64EncodeChars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";  
  2. var base64DecodeChars = new Array(-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, 62, -1, -1, -1, 63, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, -1, -1, -1, -1, -1, -1, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, -1, -1, -1, -1, -1, -1, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, -1, -1, -1, -1, -1);  
  3. /** 
  4.  * base64编码 
  5.  * @param {Object} str 
  6.  */  
  7. function base64encode(str){  
  8.     var out, i, len;  
  9.     var c1, c2, c3;  
  10.     len = str.length;  
  11.     i = 0;  
  12.     out = "";  
  13.     while (i < len) {  
  14.         c1 = str.charCodeAt(i++) & 0xff;  
  15.         if (i == len) {  
  16.             out += base64EncodeChars.charAt(c1 >> 2);  
  17.             out += base64EncodeChars.charAt((c1 & 0x3) << 4);  
  18.             out += "==";  
  19.             break;  
  20.         }  
  21.         c2 = str.charCodeAt(i++);  
  22.         if (i == len) {  
  23.             out += base64EncodeChars.charAt(c1 >> 2);  
  24.             out += base64EncodeChars.charAt(((c1 & 0x3) << 4) | ((c2 & 0xF0) >> 4));  
  25.             out += base64EncodeChars.charAt((c2 & 0xF) << 2);  
  26.             out += "=";  
  27.             break;  
  28.         }  
  29.         c3 = str.charCodeAt(i++);  
  30.         out += base64EncodeChars.charAt(c1 >> 2);  
  31.         out += base64EncodeChars.charAt(((c1 & 0x3) << 4) | ((c2 & 0xF0) >> 4));  
  32.         out += base64EncodeChars.charAt(((c2 & 0xF) << 2) | ((c3 & 0xC0) >> 6));  
  33.         out += base64EncodeChars.charAt(c3 & 0x3F);  
  34.     }  
  35.     return out;  
  36. }  
  37. /** 
  38.  * base64解码 
  39.  * @param {Object} str 
  40.  */  
  41. function base64decode(str){  
  42.     var c1, c2, c3, c4;  
  43.     var i, len, out;  
  44.     len = str.length;  
  45.     i = 0;  
  46.     out = "";  
  47.     while (i < len) {  
  48.         /* c1 */  
  49.         do {  
  50.             c1 = base64DecodeChars[str.charCodeAt(i++) & 0xff];  
  51.         }  
  52.         while (i < len && c1 == -1);  
  53.         if (c1 == -1)   
  54.             break;  
  55.         /* c2 */  
  56.         do {  
  57.             c2 = base64DecodeChars[str.charCodeAt(i++) & 0xff];  
  58.         }  
  59.         while (i < len && c2 == -1);  
  60.         if (c2 == -1)   
  61.             break;  
  62.         out += String.fromCharCode((c1 << 2) | ((c2 & 0x30) >> 4));  
  63.         /* c3 */  
  64.         do {  
  65.             c3 = str.charCodeAt(i++) & 0xff;  
  66.             if (c3 == 61)   
  67.                 return out;  
  68.             c3 = base64DecodeChars[c3];  
  69.         }  
  70.         while (i < len && c3 == -1);  
  71.         if (c3 == -1)   
  72.             break;  
  73.         out += String.fromCharCode(((c2 & 0XF) << 4) | ((c3 & 0x3C) >> 2));  
  74.         /* c4 */  
  75.         do {  
  76.             c4 = str.charCodeAt(i++) & 0xff;  
  77.             if (c4 == 61)   
  78.                 return out;  
  79.             c4 = base64DecodeChars[c4];  
  80.         }  
  81.         while (i < len && c4 == -1);  
  82.         if (c4 == -1)   
  83.             break;  
  84.         out += String.fromCharCode(((c3 & 0x03) << 6) | c4);  
  85.     }  
  86.     return out;  
  87. }  
  88. /** 
  89.  * utf16转utf8 
  90.  * @param {Object} str 
  91.  */  
  92. function utf16to8(str){  
  93.     var out, i, len, c;  
  94.     out = "";  
  95.     len = str.length;  
  96.     for (i = 0; i < len; i++) {  
  97.         c = str.charCodeAt(i);  
  98.         if ((c >= 0x0001) && (c <= 0x007F)) {  
  99.             out += str.charAt(i);  
  100.         }  
  101.         else   
  102.             if (c > 0x07FF) {  
  103.                 out += String.fromCharCode(0xE0 | ((c >> 12) & 0x0F));  
  104.                 out += String.fromCharCode(0x80 | ((c >> 6) & 0x3F));  
  105.                 out += String.fromCharCode(0x80 | ((c >> 0) & 0x3F));  
  106.             }  
  107.             else {  
  108.                 out += String.fromCharCode(0xC0 | ((c >> 6) & 0x1F));  
  109.                 out += String.fromCharCode(0x80 | ((c >> 0) & 0x3F));  
  110.             }  
  111.     }  
  112.     return out;  
  113. }  
  114. /** 
  115.  * utf8转utf16 
  116.  * @param {Object} str 
  117.  */  
  118. function utf8to16(str){  
  119.     var out, i, len, c;  
  120.     var char2, char3;  
  121.     out = "";  
  122.     len = str.length;  
  123.     i = 0;  
  124.     while (i < len) {  
  125.         c = str.charCodeAt(i++);  
  126.         switch (c >> 4) {  
  127.             case 0:  
  128.             case 1:  
  129.             case 2:  
  130.             case 3:  
  131.             case 4:  
  132.             case 5:  
  133.             case 6:  
  134.             case 7:  
  135.                 // 0xxxxxxx  
  136.                 out += str.charAt(i - 1);  
  137.                 break;  
  138.             case 12:  
  139.             case 13:  
  140.                 // 110x xxxx 10xx xxxx  
  141.                 char2 = str.charCodeAt(i++);  
  142.                 out += String.fromCharCode(((c & 0x1F) << 6) | (char2 & 0x3F));  
  143.                 break;  
  144.             case 14:  
  145.                 // 1110 xxxx10xx xxxx10xx xxxx  
  146.                 char2 = str.charCodeAt(i++);  
  147.                 char3 = str.charCodeAt(i++);  
  148.                 out += String.fromCharCode(((c & 0x0F) << 12) | ((char2 & 0x3F) << 6) | ((char3 & 0x3F) << 0));  
  149.                 break;  
  150.         }  
  151.     }  
  152.     return out;  
  153. }  
posted @ 2016-04-17 12:44  pikaqiu^_^  阅读(177)  评论(0编辑  收藏  举报