<Other> 关于哈希算法

前言

　　做应用层的人，一提到算法和数据结构就感觉很难，很高深，我以前也是这样，现在当然还是这样。大学的时候，毕设的课题就是地图匹配算法，那时候哪懂这些，基本就是老师说一点，然后写一点，要不就是网上论文找来找去，根本不知道自己在干什么。

Hash算法

　　其实就算做web引用，也需要了解一些算法。

　　我们都知道Object类带有一个hashCode的方法，但是没有给实现，，一般来说我从来不会用到这个方法，也基本不会去重写这个方法，那这个方法用来干什么的呢？

　　hashcode是用来提高查找元素效率的！为什么？

　　map是一个非常常用的数据结构，但是如果在放在内存中随意存放的话，查找的时候非常麻烦，所以我们利用hash表来整理归类这些数据，具体这样做：

　　1.将对象通过hash算法生成一个2^32范围内的int值，然后根据一个因子（一把来说是表的长度）来取模，将2^32范围内的hash压缩到因子大小。并存入表（其实是一个数组）中，这个表就叫哈希表。

　　2.查找该值的时候，直接取查找的key的哈希值hk，然后arr[hk]就能直接找到了，如果不考虑hash冲突的情况，时间复杂度是O(1)，如果有n个冲突，复杂度就是O(n)。

　　3.这种方法的代价是需要申请内存来维护一个哈希表，以及每次添加获取的时候需要经过hash算法，但这些代价都是值得的。

　　哈希冲突，这个问题有四种解决办法，这里不作详细讨论，可以记住的是HashMap中，用的是链地址法。

　　hashcode有一个很重要的特性，两个对象的hashcode相等，两个对象不一定相等，而两个对象相等，则它们的hashcode一定相等。

　　怎么理解这一点呢，比如，有一个类持有wage和cost两个变量，我们重写它的hashcode方法，返回值为wage-cost。现在有两个对象，A对象：wage：5000，cost：3000，B对象：wage：4000，cost2000，那么他们的hashcode是不是就一样了，而这两个对象明显是不一样的。而两个对象一样（equals为true），那么它们的hashcode就一定一样的。

　　这里就牵扯到equals（）方法，首先我们搞清楚equals和==的区别，前者是说两个对象一样，就想好双胞胎，后者说的是两个是同一个对象，就好像是同一个人。

　　这是String类的equals方法，那么首先它来判断两个对象是不是同一个，如果是，直接返回true。否则继续判断是否是相同类型，如果一个是人一个是狗就不用再比较下去了，然后再判断内在的东西是否相同（比如这里的String就比较长度啦，每一个具体的char啦）。从这里我们可以总结出来，equals（）判断的三个流程：

　　　　1.==：判断内存地址

　　　　2.instanceof：判断类型

　　　　3.具体成员判断：比如说前面提到的那个类，就比较cost和wage。

　　什么时候需要我自己重写hashcode呢，就是你的类需要作为key放到以hash为基础的容器（hashmap、hashset、hashtable等）里面的时候。

posted @ 2015-04-16 17:56 丶千纸鸢阅读(215) 评论(0) 收藏举报

刷新页面返回顶部

<Other> 关于哈希算法

前言

Hash算法

公告