Java集合【1】--俯瞰java集合分类
(一) java集合分类
之前大概分为三种,Set
,List
,Map
三种,JDK5之后,增加Queue
.主要由Collection
和Map
两个接口衍生出来,同时Collection
接口继承Iterable
接口,所以我们也可以说java里面的集合类主要是由Iterable
和Map
两个接口以及他们的子接口或者其实现类组成。我们可以认为Collection
接口定义了单列集合的规范,每次只能存储一个元素,而Map
接口定义了双列集合的规范,每次能存储一对元素。
Iterable
接口:主要是实现遍历功能Collection
接口: 允许重复Set
接口:无序,元素不可重复,访问元素只能通过元素本身来访问。List
接口:有序且可重复,可以根据元素的索引来访问集合中的元素。Queue
接口:队列,一般先进先出,可重复
Map
接口:映射关系,简单理解为键值对<Key,Value>,Key不可重复,与Collection
接口关系不大,只是个别函数使用到。
(1) Iterable接口
1. 内部定义的方法
java集合 最源头的接口,实现这个接口的作用主要是集合对象可以通过迭代器去遍历每一个元素。
源码如下:
从上面可以看出,foreach
迭代以及可分割迭代,都加了default
关键字,这个是Java 8 新的关键字,以前接口的所有接口,具体子类都必须实现,而对于deafult
关键字标识的方法,其子类可以不用实现,这也是接口规范发生变化的一点。
下面我们分别展示三个接口的调用:
1.1 iterator方法
当然也可以使用for-each loop
方式遍历
但是实际上,这种写法在class
文件中也是会转成迭代器形式,这只是一个语法糖。class
文件如下:
需要注意的一点是,迭代遍历的时候,如果删除或者添加元素,都会抛出修改异常,这是由于快速失败【fast-fail】
机制,属于一种自我保护的机制。
从下面的错误我们可以看出,第一个元素是有被打印出来的,也就是remove操作是成功的,只是遍历到第二个元素的时候,迭代器检查,发现被改变了,所以抛出了异常。
1.2 forEach方法
其实就是把对每一个元素的操作当成了一个对象传递进来,对每一个元素进行处理。
同时,我们只要实现Consumer
接口,就可以自定义动作,如果不自定义,默认迭代顺序是按照元素的顺序。
输出的结果:
1.3 spliterator方法
这是一个为了并行遍历数据元素而设计的迭代方法,返回的是Spliterator
,是专门并行遍历的迭代器。以发挥多核时代的处理器性能,java默认在集合框架中提供了一个默认的Spliterator
实现,底层也就是Stream.isParallel()
实现的,我们可以看一下源码:
使用的方法如下:
tryAdvance()
一个一个元素进行遍历forEachRemaining()
顺序地分块遍历trySplit()
进行分区形成另外的Spliterator
,使用在并行操作中,分出来的是前面一半,就是不断把前面一部分分出来
结果如下:
还有一些其他的用法在这里就不列举了,主要是trySplit()
之后,可以用于多线程遍历。理想的时候,可以平均分成两半,有利于并行计算,但是不是一定平分的。
2. Collection接口 extend Iterable
Collection
接口可以算是集合类的一个根接口之一,一般不能够直接使用,只是定义了一个规范,定义了添加,删除等管理数据的方法。继承Collection
接口的有List
,Set
,Queue
,不过Queue
定义了自己的一些接口,相对来说和其他的差异比较大。
2.1 内部定义的方法
源码如下:
里面获取并行流的方法parallelStream()
,其实就是通过默认的ForkJoinPool
(主要用来使用分治法(Divide-and-Conquer Algorithm)来解决问题),提高多线程任务的速度。我们可以使用ArrayList来演示一下平行处理能力。例如下面的例子,输出的顺序就不一定是1,2,3...,可能是乱序的,这是因为任务会被分成多个小任务,任务执行是没有特定的顺序的。
2.2 继承Collection的主要接口
2.2.1 List extend Collection
继承于Collection
接口,有顺序,取出的顺序与存入的顺序一致,有索引,可以根据索引获取数据,允许存储重复的元素,可以放入为null的元素。
最常见的三个实现类就是ArrayList
,Vector
,LinkedList
,ArrayList
和Vector
都是内部封装了对数组的操作,唯一不同的是,Vector
是线程安全的,而ArrayList
不是,理论上ArrayList
操作的效率会比Vector
好一些。
里面是接口定义的方法:
上面的方法都比较简单,值得一提的是里面出现了ListIterator
,这是一个功能更加强大的迭代器,继承于Iterator
,只能用于List
类型的访问,拓展功能例如:通过调用listIterator()
方法获得一个指向List开头的ListIterator
,也可以调用listIterator(n)
获取一个指定索引为n的元素的ListIterator
,这是一个可以双向移动的迭代器。
操作数组索引的时候需要注意,由于List的实现类底层很多都是数组,所以索引越界会报错IndexOutOfBoundsException
。
说起List的实现子类:
ArrayList
:底层存储结构是数组结构,增加删除比较慢,查找比较快,是最常用的List集合。线程不安全。LinkedList
:底层是链表结构,增加删除比较快,但是查找比较慢。线程不安全。Vector
:和ArrayList差不多,但是是线程安全的,即同步。
2.2.2 Set extend Collection
Set
接口,不允许放入重复的元素,也就是如果相同,则只存储其中一个。
下面是源码方法:
主要的子类:
HashSet
- 允许空值
- 通过
HashCode
方法计算获取hash
值,确定存储位置,无序。
LinkedHashSet
HashSet
的子类- 有顺序
TreeSet
- 如果无参数构建
Set
,则需要实现Comparable
方法。 - 亦可以创建时传入比较方法,用于排序。
- 如果无参数构建
2.2.3 Queue extend Collection
队列接口,在Collection
接口的接触上添加了增删改查接口定义,一般默认是先进先出,即FIFO
,除了优先队列和栈,优先队列是自己定义了排序的优先顺序,队列中不允许放入null元素。
下面是源码:
主要的子接口以及实现类有:
- Deque(接口):Queue的子接口,双向队列,可以从两边存取
- ArrayDeque:Deque的实现类,底层用数组实现,数据存贮在数组中
- AbstractQueue:Queue的子接口,仅实现了add、remove和element三个方法
- PriorityQueue:按照默认或者自己定义的顺序来排序元素,底层使用堆(完全二叉树)实现,使用动态数组实现,
- BlockingQueue: 在java.util.concurrent包中,阻塞队列,满足当前无法处理的操作。
(2) Map接口
- 定义双列集合的规范
Map<K,V>
,每次存储一对元素,即key
和value
。 key
的类型可以和value
的类型相同,也可以不同,任意的引用类型都可以。key
是不允许重复的,但是value
是可以重复的,所谓重复是指计算的hash
值。
下面的源码的方法:
值得注意的是,Map里面定义了一个Entry类,其实就是定义了一个存储数据的类型,一个entry就是一个<key,value>
.
Map的常用的实现子类:
HashMap
:由数组和链表组成,线程不安全,无序。LinkedHashMap
:如果我们需要是有序的,那么就需要它,时间和空间效率没有HashMap
那么高,底层是维护一条双向链表,保证了插入的顺序。ConcurrentHashMap
:线程安全,1.7JDK使用锁分离,每一段Segment都有自己的独立锁,相对来说效率也比较高。JDK1.8抛弃了Segment,使用Node数组+链表和红黑树实现,在线程安全控制上使用Synchronize
和CAS
,可以认为是优化的线程安全的HashMap
。HashTable
:对比与HashMap
主要是使用关键字synchronize
,加上同步锁,线程安全。
(二)总结
这些集合原始接口到底是什么?为什么需要?
我想,这些接口其实都是一种规则/规范的定义,如果不这么做也可以,所有的子类自己实现,但是从迭代以及维护的角度来说,这就是一种抽象或者分类,比如定义了Iterator
接口,某一些类就可以去继承或者实现,那就得遵守这个规范/契约。可以有所拓展,每个子类的拓展不一样,所以每个类就各有所长,但是都有一个中心,就是原始的集合接口。比如实现Map
接口的所有类的中心思想都不变,都是<key,value>
只是各有所长,各分千秋,形成了大千集合世界。
此文章仅代表自己(本菜鸟)学习积累记录,或者学习笔记,如有侵权,请联系作者删除。人无完人,文章也一样,文笔稚嫩,在下不才,勿喷,如果有错误之处,还望指出,感激不尽~
技术之路不在一时,山高水长,纵使缓慢,驰而不息。
公众号:秦怀杂货店
__EOF__

本文链接:https://www.cnblogs.com/Damaer/p/13812263.html
关于博主:评论和私信会在第一时间回复。或者直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
声援博主:如果您觉得文章对您有帮助,可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· .NET Core 托管堆内存泄露/CPU异常的常见思路
· PostgreSQL 和 SQL Server 在统计信息维护中的关键差异
· C++代码改造为UTF-8编码问题的总结
· DeepSeek 解答了困扰我五年的技术问题
· 一个费力不讨好的项目,让我损失了近一半的绩效!
· 清华大学推出第四讲使用 DeepSeek + DeepResearch 让科研像聊天一样简单!
· 实操Deepseek接入个人知识库
· CSnakes vs Python.NET:高效嵌入与灵活互通的跨语言方案对比
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库