Hash介绍

      Hash,一般翻译做"散列",也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射, pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。
      简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
      HASH主要用于信息安全领域中加密算法,他把一些不同长度的信息转化成杂乱的128位的编码里,叫做HASH值. 也可以说,hash就是找到一种数据内容和数据存放地址之间的映射关系。
      了解了hash基本定义,就不能不提到一些著名的hash算法,MD5 和 SHA1 可以说是目前应用最广泛的Hash算法,而它们都是以 MD4 为基础设计的。那么他们都是什么意思呢?

1) MD4 
MD4(RFC 1320)是 MIT 的 Ronald L. Rivest 在 1990 年设计的,MD 是 Message Digest(消息消化) 的缩写。它适用在32位字长的处理器上用高速软件实现--它是基于 32 位操作数的位操作来实现的。

2) MD5 
MD5(RFC 1321)是 Rivest 于1991年对MD4的改进版本。它对输入仍以512位分组,其输出是4个32位字的级联,与 MD4 相同。MD5比MD4来得复杂,并且速度较之要慢一点,但更安全,在抗分析和抗差分方面表现更好

3) SHA1 及其他 
SHA1是由NIST NSA设计为同DSA一起使用的,它对长度小于264的输入,产生长度为160bit的散列值,因此抗穷举(brute-force)性更好。SHA-1 设计时基于和MD4相同原理,并且模仿了该算法。

 

一种以String为key的Hash函数:

public static int hash( String key, int tableSize )
{
      int hashval = 0;
      for(int i=0; i<key.length();i++){
               hashval = hashval * 37   + key.charAt( i );
     }
     hashval %= tableSize;
     if(hashval<0)
             hashval  +=  tableSize;
       return hashval;
}

以上代码将要处理的字符串key中的每个char都与hashval*37后的值相加,再与tableSize作取余运算求得Hash结果在Hash表中的位置。

posted @ 2014-02-18 19:38  XIAOSHUA  阅读(380)  评论(0编辑  收藏  举报