20162325 金立清 S2 W11 C20

20162325 2017-2018-2 《程序设计与数据结构》第11周学习总结

教材关键概念摘要


在哈希方法中,元素保存在哈希表中,其在表中的位置由哈希函数确定。
两个元素或关键字映射到表中同一个位置的情形,称为冲突。
将每个元素映射到表中唯一位置的哈希函数称为理想哈希函数。
抽取仅适用元素值或关键字中的一部分来计算保存元素的位置。
在移位折叠方法中,将关键字的各部分加在一起计算下标。
将字符串中各字符按二进制格式进行处理,长度依赖方法和平方取中方法也适用于字符串。
虽然Java为所有的对象提供了hashcode方法,最好还是为特定的类定义一个具体的哈希函数。
处理冲突的链式方法,将哈希表看成是集合的表而不是各独立单元的表。
处理冲突的开放地址方法,即在表中寻找不同于该元素 初次哈希到的另一个开放的位置。
装载因子是哈希表扩展之前,表中允许的最大占有百分比。

哈希方法


HashCode是返回对象的哈希码。跟HashMap和Hashtable没多大关系。
HashTable是方法是同步的,HashMap不是。
HashMap中可以存在一条key或value为空的记录,Hashtable不可以。
HashTable继承自Dictionary,HashMap继承自Map接口。

HashCode
在Java中,哈希码代表对象的特征。
  例如对象 String str1 = “aa”, str1.hashCode= 3104
  String str2 = “bb”, str2.hashCode= 3106
  String str3 = “aa”, str3.hashCode= 3104
  根据HashCode由此可得出str1!=str2,str1==str3
  哈希码产生的依据:哈希码并不是完全唯一的,它是一种算法,让同一个类的对象按照自己不同的特征尽量的有不同的哈希码,但不表示不同的对象哈希码完全不同。也有相同的情况,看程序员如何写哈希码的算法。
  下面给出几个常用的哈希码的算法。
  1:Object类的hashCode.返回对象的内存地址经过处理后的结构,由于每个对象的内存地址都不一样,所以哈希码也不一样。
  2:String类的hashCode.根据String类包含的字符串的内容,根据一种特殊算法返回哈希码,只要字符串内容相同,返回的哈希码也相同。
  3:Integer类,返回的哈希码就是Integer对象里所包含的那个整数的数值,例如Integer i1=new Integer(100),i1.hashCode的值就是100 。由此可见,2个一样大小的Integer对象,返回的哈希码也一样。

类 HashMap<K,V>

 java.lang.Object
  java.util.AbstractMap<K,V>
      java.util.HashMap<K,V>

类型参数:
K - 此映射所维护的键的类型
V - 所映射值的类型

基于哈希表的 Map 接口的实现。此实现提供所有可选的映射操作,并允许使用 null 值和null 键。(除了非同步和允许使用 null 之外,HashMap 类与 Hashtable 大致相同。)此类不保证映射的顺序,特别是它不保证该顺序恒久不变。

HashCode和HashMap之间的关系

import java.util.HashMap;
public class Test {

	//重写Equals不重写HashCode
	static class Key {
		private Integer id;
		private String value;
		
		public Key(Integer id, String value) {
			super();
			this.id = id;
			this.value = value;
		}
		@Override
		public boolean equals(Object o) {
			if(o == null || !(o instanceof Key)) {
				return false;
			}else {
				return this.id.equals(((Key)o).id);
			}
		}
	}
	//重写Equals也重写HashCode
		static class Key_ {
			private Integer id;
			private String value;
			
			public Key_(Integer id, String value) {
				super();
				this.id = id;
				this.value = value;
			}
			@Override
			public boolean equals(Object o) {
				if(o == null || !(o instanceof Key_)) {
					return false;
				}else {
					return this.id.equals(((Key_)o).id);
				}
			}
			@Override
			public int hashCode() {
				 return id.hashCode();
			}
			 
		}
	public static void main(String[] args) {
		//test hashcode
		HashMap<Object, String> values = new HashMap<Object, String>(5);
		Test.Key key1 =   new Test.Key(1, "one");
		Test.Key key2 =   new Test.Key(1, "one");
		System.out.println(key1.equals(key2));
		values.put(key1, "value 1");
		System.out.println(values.get(key2));
		
		Test.Key_ key_1 =   new Test.Key_(1, "one");
		Test.Key_ key_2 =   new Test.Key_(1, "one");
		System.out.println(key_1.equals(key_2));
		System.out.println(key_1 == key_2);
		values.put(key_1, "value 1");
		System.out.println(values.get(key_2));
	}
}

由上述例子可见:
只重写了equasl方法的Key类 在用做Hash中的键值的时候 两个equasl为true的对象不能获取相应 的Value的
而重写了hashCode方法和equals方法的key_类 两个相等的对象 可以获取同一个Value的,这样更符合生活中 的逻辑
HashMap对象是根据Key的hashCode来获取对应的Vlaue 因而两个HashCode相同的对象可以获取同一个Value

哈希函数


  • 实际中的Hash函数是指把一个大范围映射到一个小范围。把大范围映射到一个小范围的目的往往是为了节省空间,使得数据容易保存。除此以外,Hash函数往往应用于查找上。所以,在考虑使用Hash函数之前,需要明白它的几个限制:
  1. Hash的主要原理就是把大范围映射到小范围;所以,你输入的实际值的个数必须和小范围相当或者比它更小。不然冲突就会很多。
  2. 由于Hash逼近单向函数;所以,你可以用它来对数据进行加密。
  3. 不同的应用对Hash函数有着不同的要求;比如,用于加密的Hash函数主要考虑它和单项函数的差距,而用于查找的Hash函数主要考虑它映射到小范围的冲突率。
  • Hash函数应用的主要对象是数组(比如,字符串),而其目标一般是一个int类型。以下我们都按照这种方式来说明。

一般的说,Hash函数可以简单的划分为如下几类:

  1. 加法Hash;
  2. 位运算Hash;
  3. 乘法Hash;
  4. 除法Hash;
  5. 查表Hash;
  6. 混合Hash;

解决冲突


  
常用的解决hash冲突的方法

开放地址法
拉链法(链地址法)
多重散列法(再哈希法)
公共溢出区法

具体参见【java基础 10】hash算法冲突解决方法 - CSDN博客

从哈希表中删除元素


List

public class Demo {
 
    public static void main(String[] args) {
        List<Object> obj = new ArrayList<Object>();
        obj.add("a");
        obj.add("b");
        obj.add("c");
        System.out.println("移除前:" + obj.toString());
        Iterator<Object> it = obj.iterator();
        for(int i=0; i<obj.size(); i++){
            System.out.println(i);
            Object name = it.next();
            if("a".equals(name) || "b".equals(name)){
                it.remove();
                i--;
            }
        }
        System.out.println("移除后: " + obj.toString());
         
    }

Set

public class Demo {
 
    public static void main(String[] args) {
        Set<Object> obj = new HashSet<Object>();
        obj.add("a");
        obj.add("b");
        obj.add("c");
        System.out.println("移除前:" + obj.toString());
        Iterator<Object> it = obj.iterator();
        for(int i=0; i<obj.size(); i++){
            System.out.println(i);
            Object name = it.next();
            if("a".equals(name) || "b".equals(name)){
                it.remove();
                i--;
            }
        }
        System.out.println("移除后: " + obj.toString());
         
    }

API中的哈希表


  • 比较常用的有
    HashtableHashMapHashSetHashCode

教材学习中的问题和解决过程


  • 问题1:课堂测试题

七点不同

第一,继承的父类不同。
第二,线程安全性不同。
第三,是否提供contains方法第四,key和value是否允许null值。
第五,两个遍历方式的内部实现上不同。
第六,hash值不同。
第七,内部实现使用的数组初始化和扩容方式不同。

代码调试中的问题和解决过程


  • 问题1:JDK中有些方法、类被划了横杠

  • 解答:

代码托管


上周考试错题总结


  • 活动尚未结束

本周结对学习情况


  • 20162311
  • 结对学习内容
    - 如何画AOE网,求关键路径

其他(感悟、思考等,可选)


  • 这周的班级活动和口语考试占用了部分时间,再加上还有团队任务,时间上就很紧张,又是熬夜才完成的博客……然而明天还有当天截止的实验四,感觉有点吃不消。

学习进度条


代码行数(新增/累积) 博客量(新增/累积) 学习时间(新增/累积) 重要成长
目标 5000行 30篇 400小时
第一周 58/ 1/1 10/10
第二周 8/18
第三周 134/ 3/4 12/ 30
第四周 2/6 12/42
第五&六周 750/ 6595 5/11 24/66
第七周 764/7068 7/13 18/84
第八周 888/7956 9/15 20/104
第九周 475/8431 12/18 22/126
第十周 1429/9860 16/22 24/150
第十一周 977/10837 19/25 48/198
  • 计划学习时间: 23小时

  • 实际学习时间: 24小时

  • 改进情况:多思考,多总结

参考资料


posted @ 2017-11-19 21:37  20162325金立清  阅读(268)  评论(0编辑  收藏  举报