算法篇(前序)——Java的集合
菜鸟拙见,望请纠正:附上JDK参考文档(中文文档和英文文档):链接:https://pan.baidu.com/s/14KDmCtQxeGCViq7e0zENjA 密码:e9xs 以及算法篇全文链接 https://www.cnblogs.com/nullering/p/9536339.html
一:前言
说完了数据结构的基础认知,我想扯一个外传——Java的集合。Java的集合只是一些能够盛放对象的容器,而这些容器的实现,则是用了不同的数据结构,我们在使用Java语言时,这些集合类就是我们最好的工具。
如图所示,这是Java的集合的抽象类和具体的实现类,抽象接口类不能实例化,必须由具体实现类进行实例化操作。
二:List接口及其实现类ArrayList
List是元素有序并且可以重复的集合,被称为序列
List可以精确的控制每个元素的插入位置,或删除某个位置元素
基本操作:
(1)、添加
void add(int Index , E element):在list的指定位置插入元素
void addAll(int index , Collection<? Extends E> e):将指定collection中的所有元素插入到列表中的指定位置
(2)、删除
E remove(int Index):删除指定位置的元素,并返回该元素;
(3)、修改
E set(int index , E element):替换指定位置的元素,并返回被替换的元素
(4)、获取
Int indexOf(Object o):返回指定元素第一次出现的索引,如果该list中不含则返回-1;
E get(int Index):返回指定位置的元素;
List<E> sublist(int fromIndex , int toIndex):返回列表指定的fromIndex(包括)和toIndex(不包括)之间的部分视图(list);
实现类ArrayList(常用)
ArrayList——数组序列,是List的一个重要实现类
ArrayList底层是由数组实现的,可以动态增加容量
具体操作参考JDK参考文档
实现类LinkedList
LinkedList是基于链表实现的,是一个双向循环列表。不是线程安全的。
具体操作参考JDK参考文档
三:Set接口及其实现类
集合Set是Collection的子接口,Set不允许其数据元素重复出现,也就是说在Set中每一个数据元素都是唯一的。
虽然集合号称存储的是 Java 对象,但实际上并不会真正将 Java 对象放入 Set 集合中,只是在 Set 集合中保留这些对象的引用而言。也就是说:Java 集合实际上是多个引用变量所组成的集合,这些引用变量指向实际的 Java 对象。
基本操作:
实现类HashSet(常用)
HashSet通过Hash算法排布集合内的元素,所谓的Hash算法就是把任意长度的输入(又叫做预映射),通过散列算法,变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射。对于不同类型的信息,其散列值公式亦不完全相同。
当我们使用HashSet存储自定义类时,需要在自定义类中重写equals和hashCode方法,主要原因是集合内不允许有重复的数据元素,在集合校验元素的有效性时(数据元素不可重复),需要调用equals和hashCode验证。
具体方法请参考说明文档
实现类TreeSet
TreeSet可以确保集合元素处于排序状态。TreeSet采用红黑树的数据结构来存储集合元素。
TreeSet会调用集合元素的compareTo(Object o)方法来比较元素之间的大小关系,然后将集合元素按升序排列,这种方式是自然排序。
Java提供了一个Comparable接口,该接口定义一个compareTo(Object o)方法,该方法返回一个整数值,实现该接口的类必须实现该方法,实现该接口的类的对象就可以比较大小。当一个对象调用该方法与另一个对象进行比较时,例如:obj1.compareTo(obj2),如果该方法返回0,则代表这两个对象相等;如果该方法返回一个正整数,则表明obj1大于obj2;如果该方法返回一个负整数,则表明obj1小于obj2。
1 @Override 2 public int compare(People o1, People o2) { 3 //先按年龄比较,如果年龄相等,则按姓名 4 if(o1.getAge()==o2.getAge()) 5 return o1.getName().compareTo(o2.getName()); 6 else 7 return o1.getAge()-o2.getAge(); 8 }
其他方法参考JDK文档
四:Queue接口及其实现类
顾名思义,Queue用于模拟队列这种数据结构。队列先进先出。
Queue接口有一个PriorityQueue实现类。除此之外,Queue还有一个Deque接口,Deque代表一个“双端队列”,双端队列可以同时从两端删除或添加元素,因此Deque可以当作栈来使用。java为Deque提供了ArrayDeque实现类和LinkedList实现类。
Queue接口中定义了如下的几个方法:
void add(Object e): 将指定元素插入到队列的尾部。
object element(): 获取队列头部的元素,但是不删除该元素。
boolean offer(Object e): 将指定的元素插入此队列的尾部。当使用容量有限的队列时,此方法通常比add(Object e)有效。
Object peek(): 返回队列头部的元素,但是不删除该元素。如果队列为空,则返回null。
Object poll(): 返回队列头部的元素,并删除该元素。如果队列为空,则返回null。
Object remove(): 获取队列头部的元素,并删除该元素。
PriorityQueue实现类
PriorityQueue是一个比较标准的队列实现类。之所以是比较标准的原因是PriorityQueue保存队列元素的顺序并不是按照加入队列的顺序,而是按照队列元素的大小进行重新排序。因此当调用peek()或者是poll()的方法取出队列中的元素通常都是最小的元素。
PriorityQueue不允许插入null元素,还要对队列元素进行排序。具体方法参考JDK文档
五:Map接口及其实现类
- Map提供了一种映射关系,其中的元素是以键值对(key-value)的形式存储的,能够实现根据key快速查找value;
- key值不可重复,value值可以重复,一个value值可以和很多key值形成对应关系,每个建最多只能映射到一个值
- Map 中元素的顺序取决于迭代器迭代时的顺序,有的实现类保证了元素输入输出时的顺序,比如说 TreeMap;有的实现类则是无序的,比如 HashMap。
- key,value 都可以是任何引用类型的数据,包括 null
常用方法:
1、添加:
V put(K key, V value) (可以相同的key值,但是添加的value值会覆
盖前面的,返回值是前一个,如果没有就返回null)
putAll(Map<? extends K,? extends V> m) 从指定映射中将所有映射关
系复制到此映射中(可选操作)。
2、删除
remove() 删除关联对象,指定key对象
clear() 清空集合对象
3、获取
value get(key); 可以用于判断键是否存在的情况。当指定的键不存在的时候,返
回的是null。
4、判断:
boolean isEmpty() 长度为0返回true否则false
boolean containsKey(Object key) 判断集合中是否包含指定的key
boolean containsValue(Object value) 判断集合中是否包含指定的value
5、长度:
Int size()
实现类HashMap(重点)
HashMap不是线程安全的,如果想要线程安全的HashMap,可以通过Collections类的静态方法synchronizedMap获得线程安全的HashMap。
HashMap的底层主要是基于数组,链表和红黑树来实现的,它之所以有相当快的查询速度主要是因为它是通过计算散列码来决定存储的位置。HashMap中主要是通过key的hashCode来计算hash值的,只要hashCode相同,计算出来的hash值就一样。如果存储的对象对多了,就有可能不同的对象所算出来的hash值是相同的,这就出现了所谓的hash冲突。
具体方法看JDK文档,建议看一下其源码实现,因为HashMap以后用到的很多,只是知道其几个简单的使用方法是远远不够的,但是这里只是简单认知,我就不再赘述,如果可以,以后会出。
实现类TreeMap
TreeMap是非线程安全的。
可以采用可以通过Collections类的静态方法synchronizedMap获得线程安全:Map m = Collections.synchronizedSortedMap(new TreeMap(…));
TreeMap是用键来进行升序顺序来排序的。通过Comparable 或 Comparator来排序。 (实现和TreeSet基本一致)。
HashMap与TreeMap的区别
- 实现方式
HashMap:基于哈希表实现。使用HashMap要求添加的键类明确定义了hashCode()和equals()[可以重写hashCode()和equals()],为了优化HashMap空间的使用,您可以调优初始容量和负载因子。
(1)HashMap(): 构建一个空的哈希映像
(2)HashMap(Map m): 构建一个哈希映像,并且添加映像m的所有映射
(3)HashMap(int initialCapacity): 构建一个拥有特定容量的空的哈希映像
(4)HashMap(int initialCapacity, float loadFactor): 构建一个拥有特定容量和加载因子的空的哈希映像
TreeMap:基于红黑树实现。TreeMap没有调优选项,因为该树总处于平衡状态。
(1)TreeMap():构建一个空的映像树
(2)TreeMap(Map m): 构建一个映像树,并且添加映像m中所有元素
(3)TreeMap(Comparator c): 构建一个映像树,并且使用特定的比较器对关键字进行排序
(4)TreeMap(SortedMap s): 构建一个映像树,添加映像树s中所有映射,并且使用与有序映像s相同的比较器排序 - 用途
HashMap:适用于在Map中插入、删除和定位元素。
TreeMap:适用于按自然顺序或自定义顺序遍历键(key)。
HashMap通常比TreeMap快一点(树和哈希表的数据结构使然),建议多使用HashMap,在需要排序的Map时候才用TreeMap.
HashMap与HashTable的区别
1:他们都可以存储key-value型数据
2:HashMap是线程不安全的效率高,HashTable是线程安全的,效率低
要想既安全又效率高就用ConcurrentHashMap
3:HashMap是可以把null作为key或者value的,但是HashTable不行