64进制 - 林冠逹

公告

NND 转来后才发现这个算法错的太离谱了，呵呵，对不住大家了，之后我会改正算法的。不过大家可以先看一下思想

64进制，所用的字符是“0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ+/”。

一直以来使用16进制从来没有注意过a~f到底是大写还是小写，这次要使用64进制，着实需要看清楚了。参考了apache的codec里关于2进制转换16进制的方法，2进制转换64进制也是同样道理。将byte数组中的一个字节分为两个字节组成char数组，一个byte字节对应0xC0 & data[i] >>>6和0x3F & data[i]，这样构成的char数组即为64进制的char数组，再将其转为String即可使用。
对于进制转换关键是要把位、字节、字符、字符串的概念弄清楚。
一个带符号的字节能表示的数值范围是-127~128，因此我们无论转换进制为2进制、8进制、16进制等等，甚至是128进制都可以考虑按位操作进行进制转换，Apache的commons-codec项目中针对16进制转换的方法代码如下：

public static char[] encodeHex(byte[] data) {
    int l = data.length;
    char[] out = new char[l << 1];
    // two characters form the hex value.
    for (int i = 0, j = 0; i < l; i++) {
        out[j++] = DIGITS[(0xF0 & data[i]) >>> 4 ];
        out[j++] = DIGITS[ 0x0F & data[i] ];
    }
    return out;
}

代码中将一个字节分为两个字节进行存储，这样一个字节转换为一个字符来表示，这样可以方便的转换任何数据不用考虑符号丢失。至于一个字节转换为两个字节的原则，根据需要转换的不同进制设定两个字节的分界点，如16进制的转换，在一个字节中表示16为00001111，那么低四位即为一个字节，高四位为另一个字节；同理，对于64进制，在一个字节中表示64为00111111，那么低六位为一个字节，高两位为另一个字节。
对于一个byte数组按照高低字节的分配，获取对应数值，通过此数值获取对应进制相关位置的字符，如16进制中第十个字符为a，那么如果低字节为10则对应16进制的字符为a，同理，高字节也对应转换，最终取得16进制的char数组，此数组转为String即为我们常见的16进制的字符串。

我的64进制的实现代码如下：

byte数组转换为64进制char数组

public static char[] encode64Digit(byte[] bytes) {
    char[] out = new char[bytes.length << 1];
    for (int i = 0, j = 0; i < bytes.length; i++) {
        out[j++] = digits64[(0xC0 & bytes[i]) >>> 6];
        out[j++] = digits64[0x3F & bytes[i]];
    }
    return out;
}

64进制char数组转换为byte数组

public static byte[] decode64Digit(char[] chars) {
    if ((0x01 & chars.length) != 0) {
        return null;
    }
    byte[] out = new byte[chars.length >> 1];
    for (int i = 0, j = 0; j < chars.length; i++) {
        int a = (getSize(chars[j]) << 6);
        j++;
        int b = getSize(chars[j]) & 0xFF;
        a = (a | getSize(chars[j]));
        j++;
        out[i] = (byte) (a & 0xFF);
    }
    return out;
}

转自：http://my.oschina.net/benbenming/blog/8563

posted on 2012-09-15 01:33 林冠逹阅读(1337) 评论(0) 编辑收藏举报

刷新页面返回顶部

冠逹小站

公告