短网址ShortUrl的算法
场景:
我们在新浪微博上公布网址的时候。微博会自己主动判别网址。并将其转换。比如:http://t.cn/hrYnr0。
为什么要这样做的,原因我想有这样几点:
1、微博限制字数为140字一条,那么假设我们须要发一些连接上去,可是这个连接很的长。以至于将近要占用我们内容的一半篇幅。这肯定是不能被同意的。所以短网址应运而生了。
2、短网址能够在我们项目里能够非常好的对开放级URL进行管理。
有一部分网址能够会涵盖性、暴力、广告等信息。这样我们能够通过用户的举报,全然管理这个连接将不出如今我们的应用中,应为相同的URL通过加密算法之后,得到的地址是一样的。
3、我们能够对一系列的网址进行流量,点击等统计,挖掘出大多数用户的关注点。这样有利于我们对项目的兴许工作更好的作出决策。
以下先来看看短网址映射算法的理论(网上找到的资料):
① 将长网址用md5算法生成32位签名串,分为4段,,每段8个字符;
② 对这4段循环处理,取每段的8个字符, 将他看成16进制字符串与0x3fffffff(30位1)的位与操作。超过30位的忽略处理。
③ 将每段得到的这30位又分成6段,每5位的数字作为字母表的索引取得特定字符,依次进行获得6位字符串;
④ 这样一个md5字符串能够获得4个6位串。取里面的随意一个就可作为这个长url的短url地址。
非常easy的理论,我们并不一定说得到的URL是唯一的。可是我们可以取出4组URL,这样差点儿不会出现太大的反复。
三、 跳转原理
当我们生成短链接之后。仅仅须要在表中(数据库或者NoSql )存储原始链接与短链接的映射关系就可以。当我们訪问短链接时,仅仅须要从映射关系中找到原始链接。就可以跳转到原始链接。
- import util.Encript;
- public class ShortUrl {
- public static void main(String[] args) {
- String url = "http://www.sunchis.com";
- for (String string : ShortText(url)) {
- print(string);
- }
- }
- public static String[] ShortText(String string){
- String key = "XuLiang"; //自己定义生成MD5加密字符串前的混合KEY
- String[] chars = new String[]{ //要使用生成URL的字符
- "a","b","c","d","e","f","g","h",
- "i","j","k","l","m","n","o","p",
- "q","r","s","t","u","v","w","x",
- "y","z","0","1","2","3","4","5",
- "6","7","8","9","A","B","C","D",
- "E","F","G","H","I","J","K","L",
- "M","N","O","P","Q","R","S","T",
- "U","V","W","X","Y","Z"
- };
- String hex = Encript.md5(key + string);
- int hexLen = hex.length();
- int subHexLen = hexLen / 8;
- String[] ShortStr = new String[4];
- for (int i = 0; i < subHexLen; i++) {
- String outChars = "";
- int j = i + 1;
- String subHex = hex.substring(i * 8, j * 8);
- long idx = Long.valueOf("3FFFFFFF", 16) & Long.valueOf(subHex, 16);
- for (int k = 0; k < 6; k++) {
- int index = (int) (Long.valueOf("0000003D", 16) & idx);
- outChars += chars[index];
- idx = idx >> 5;
- }
- ShortStr[i] = outChars;
- }
- return ShortStr;
- }
- private static void print(Object messagr){
- System.out.println(messagr);
- }
- }
- public class Encript {
- //十六进制下数字到字符的映射数组
- private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"};
- /**把inputString加密*/
- public static String md5(String inputStr){
- return encodeByMD5(inputStr);
- }
- /**
- * 验证输入的password是否正确
- * @param password 真正的password(加密后的真password)
- * @param inputString 输入的字符串
- * @return 验证结果,boolean类型
- */
- public static boolean authenticatePassword(String password,String inputString){
- if(password.equals(encodeByMD5(inputString))){
- return true;
- }else{
- return false;
- }
- }
- /**对字符串进行MD5编码*/
- private static String encodeByMD5(String originString){
- if (originString!=null) {
- try {
- //创建具有指定算法名称的信息摘要
- MessageDigest md5 = MessageDigest.getInstance("MD5");
- //使用指定的字节数组对摘要进行最后更新,然后完毕摘要计算
- byte[] results = md5.digest(originString.getBytes());
- //将得到的字节数组变成字符串返回
- String result = byteArrayToHexString(results);
- return result;
- } catch (Exception e) {
- e.printStackTrace();
- }
- }
- return null;
- }
- /**
- * 轮换字节数组为十六进制字符串
- * @param b 字节数组
- * @return 十六进制字符串
- */
- private static String byteArrayToHexString(byte[] b){
- StringBuffer resultSb = new StringBuffer();
- for(int i=0;i<b.length;i++){
- resultSb.append(byteToHexString(b[i]));
- }
- return resultSb.toString();
- }
- //将一个字节转化成十六进制形式的字符串
- private static String byteToHexString(byte b){
- int n = b;
- if(n<0)
- n=256+n;
- int d1 = n/16;
- int d2 = n%16;
- return hexDigits[d1] + hexDigits[d2];
- }
- }