NND 转来后才发现这个算法错的太离谱了,呵呵,对不住大家了,之后我会改正算法的。不过大家可以先看一下思想
64进制,所用的字符是“0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ+/”。
一直以来使用16进制从来没有注意过a~f到底是大写还是小写,这次要使用64进制,着实需要看清楚了。参考了apache的codec里关于2进制转换16进制的方法,2进制转换64进制也是同样道理。将byte数组中的一个字节分为两个字节组成char数组,一个byte字节对应0xC0 & data[i] >>>6和0x3F & data[i],这样构成的char数组即为64进制的char数组,再将其转为String即可使用。
对于进制转换关键是要把位、字节、字符、字符串的概念弄清楚。
一个带符号的字节能表示的数值范围是-127~128,因此我们无论转换进制为2进制、8进制、16进制等等,甚至是128进制都可以考虑按位操作进行进制转换,Apache的commons-codec项目中针对16进制转换的方法代码如下:
public static char[] encodeHex(byte[] data) { int l = data.length; char[] out = new char[l << 1]; // two characters form the hex value. for (int i = 0, j = 0; i < l; i++) { out[j++] = DIGITS[(0xF0 & data[i]) >>> 4 ]; out[j++] = DIGITS[ 0x0F & data[i] ]; } return out; }
代码中将一个字节分为两个字节进行存储,这样一个字节转换为一个字符来表示,这样可以方便的转换任何数据不用考虑符号丢失。至于一个字节转换为两个字节的原则,根据需要转换的不同进制设定两个字节的分界点,如16进制的转换,在一个字节中表示16为00001111,那么低四位即为一个字节,高四位为另一个字节;同理,对于64进制,在一个字节中表示64为00111111,那么低六位为一个字节,高两位为另一个字节。
对于一个byte数组按照高低字节的分配,获取对应数值,通过此数值获取对应进制相关位置的字符,如16进制中第十个字符为a,那么如果低字节为10则对应16进制的字符为a,同理,高字节也对应转换,最终取得16进制的char数组,此数组转为String即为我们常见的16进制的字符串。
我的64进制的实现代码如下:
byte数组转换为64进制char数组
public static char[] encode64Digit(byte[] bytes) { char[] out = new char[bytes.length << 1]; for (int i = 0, j = 0; i < bytes.length; i++) { out[j++] = digits64[(0xC0 & bytes[i]) >>> 6]; out[j++] = digits64[0x3F & bytes[i]]; } return out; }
64进制char数组转换为byte数组
public static byte[] decode64Digit(char[] chars) { if ((0x01 & chars.length) != 0) { return null; } byte[] out = new byte[chars.length >> 1]; for (int i = 0, j = 0; j < chars.length; i++) { int a = (getSize(chars[j]) << 6); j++; int b = getSize(chars[j]) & 0xFF; a = (a | getSize(chars[j])); j++; out[i] = (byte) (a & 0xFF); } return out; }