最全的集合笔记(干货)
1.集合基础
1.1集合概述
集合类的特点:提供一种存储空间可变的存储模型,泛型。
ArrayList:
- 可调整大小的数组实现
是一种特殊的数据类型,泛型。
怎么用:
- 在出现E的地方使用引用数据类型替换即可
- 例:ArrayList
,ArrayList
1.2ArrayList构造方法和添加方法
- public ArrayList() 创建一个空的集合对象
- public boolean add(E e) 将指定的元素追加到此集合的末尾
- public void add(int index,E element) 在此集合的指定位置插入指定元素
- Demo01.java
package com.guoba.day1215.arraylist;
import java.util.ArrayList;
public class Demo01 {
public static void main(String[] args) {
ArrayList<String> arrayList = new ArrayList<String>();
//添加元素
arrayList.add("hello");//0
arrayList.add("arraylist");//1
arrayList.add("good happy");//2
//arrayList.remove("hello");
//arrayList.set(2,"javase");
System.out.println(arrayList.get(0));
System.out.println(arrayList.get(1));
System.out.println(arrayList.get(2));
//System.out.println(arrayList.get(3));//IndexOutOfBoundsException
//System.out.println(arrayList.size());
System.out.println(arrayList);
}
}
1.3ArrayList集合常用方法
- public boolean remove(Obiject o) 删除指定元素,返回删除是否成功
- public E remove(int index) 删除指定索引初的元素,返回被删除的元素
- public E set(int index,E element) 修改......
- public E get(int index) 返回指定索引处的元素
- public int size() 返回集合元素的个数(类似length)
- Demo_BianLiStudent.java
package com.guoba.studentinformationmanagement;
/*
学生类
*/
public class Student {
private int id;
private String name;
private String sex;
private int fraction;//分数
public Student() {
}
public Student(int id, String name, String sex, int fraction) {
this.id = id;
this.name = name;
this.sex = sex;
this.fraction = fraction;
}
public int getId() {
return id;
}
public void setId(int id) {
this.id = id;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public String getSex() {
return sex;
}
public void setSex(String sex) {
this.sex = sex;
}
public int getFraction() {
return fraction;
}
public void setFraction(int fraction) {
this.fraction = fraction;
}
@Override
public String toString() {
return "Student{" +
"id=" + id +
", name='" + name + '\'' +
", sex='" + sex + '\'' +
", fraction=" + fraction +
'}';
}
}
package com.guoba.day1215.arraylist;
import com.guoba.studentinformationmanagement.Student;
import java.util.ArrayList;
public class Demo_BianLiStudent {
public static void main(String[] args) {
//创建集合对象
ArrayList<Student> as = new ArrayList<>(3);
//创建学生对象,并添加学生信息
Student student1 = new Student(1,"刘备","男",90);
Student student2 = new Student(2,"张飞","男",89);
Student student3 = new Student(3,"关羽","男",96);
//为集合添加学生对象
as.add(student1);
as.add(student2);
as.add(student3);
//循环遍历集合对象
for (int i = 0; i < as.size(); i++) {
System.out.println(as.get(i).getId()+as.get(i).getName()+as.get(i).getSex()+as.get(i).getFraction());
}
}
}
1.4Arraylist特点
- (1)底层使用数组,有序可重复
- (2)查询快,增删慢
- (3)线程不安全,运行速度快
1.5使用场景:
- 当需要对数据进行遍历访问的情况下选用Array List
2.集合进阶
2.1Collection(单列)
Collection集合概述和使用
- 集合概述
- 是单列集合的顶层接口,它表示一组对象,这些对象也称为Cellction的元素
- JDK不提供此接口的任何实现,它提供更具体的子接口(如Set和List)实现
- 创建Cellection集合的对象
- 多态的方式
- 具体的实现类ArrayList
- 练习
(1)回顾
- 特点
- 提供一种储存空间可变的储存模型,储存的数据容量可以随时发生改变
(2)体系结构
List
- 元素是有序的、可重复,可以对列表中每个元素的插入位置进行精确地控制。
- 是一个有序容器,保持了每个元素的插入顺序,输出的顺序就是插入的顺序。
- 常用的实现类有 ArrayList、LinkedList 和 Vector。
2.2List
List接口的实现类
ArrayList
用法:
1.添加元素:add()
2.删除元素:remove()
3.清空元素:clear()
4.集合长度:size()
步骤:
1.List
2.添加元素
3.for循环遍历
for(int i = 0;i<list.size();i++){
System.out.println(list.get(i));
}
特点:
(1)底层使用数组,有序、可重复
(2)查询快,增删慢
(3)线程不安全,运行速度快
使用场景
当需要对数据进行遍历访问的情况下用ArrayList
- ArrayList底层使用了Object的数组作为容器去存储数据
- ArrayList 提供了使用索引的随意访问数据
- ArrayList 是线程非安全的,效率较高,查询速度高
LinkedList
特点:
- LinkedList底层使用了链表的数据结构
- LinkedList随机位置插入、删除数据时比线性表快,遍历比线性表慢。
- 相对于ArrayList,LinkedList 对于经常需要从 List 中添加或删除元素的场合更为合适。
- 和LinkedList一样,ArrayList也是非同步的(unsynchronized)
- 查询慢,增删快
- 线程不安全,运行速度快
用法:
- 起始位置添加元素:addFirst();
- 末尾位置添加元素:addLast();
- 删除起始位置元素:removeFirst();
- 删除末尾位置元素:removeLast();
步骤:
1.创建LinkedList集合
2.添加元素add()
3.foreach遍历/迭代器
使用场景:
对数据进行多次增删和修改时采用LinkedList。
LinkedList和ArrayList集合的区别
- ArrayList:底层原理数组,有序可重复,有索引,长度可变,增删慢,查询快。
- LinkedList:底层是链表,无下标,增删快,查询慢
Vector
- Vector非常类似ArrayList,但是Vector是同步的,效率相对比较低
- Vector的底层结构也是数组,但是它们对数组的扩容方式不同
- 查询快,增删慢,效率低,线程安全
- 当Vector或ArrayList中的元素超过它的初始大小时,Vector会将它的容量翻倍,而ArrayList只增加50%的大小,这样ArrayList就有利于节约内存空间。
即Vector增长原来的一倍,ArrayList增加原来的0.5倍。
Stack栈继承于Vector,栈的存储特点是后进先出,
它基于动态数组实现的一个线程安全的栈,所以栈是线程安全的。
Set
- 元素无序的、不可重复。
- 无序容器,你无法保证每个元素的存储顺序,但是其中的TreeSet是特别的,TreeSet通过 Comparator 或者 Comparable 维护了一个排序顺序。
- 取出元素的方法只有迭代器和增强型for。
- 只允许一个 null 元素
- Set 接口最流行的几个实现类是 HashSet、LinkedHashSet 以及 TreeSet。
- Set和Map的底层联系密切,可以说想要了解Set直接先了解好Map即可
- Set说白了就是对Map的功能的限制
HashSet
用法:
- 是否有下一个:hasNext();
- 有下一个:next();
- 删除:remove();
- hashcode();判断哈希码值相等
- equals(); 判断两个对象
特点:
(1)底层使用hashtable,无序不可重复
(2)无下标,没有get方法,遍历只能iterator
(3)线程不安全,运行速度快
使用场景
快速查找。
概述:
-
HashSet底层实现其实是HashMap(看源码可以知道)
-
HashSet实现了Set接口,它不允许集合中出现重复元素。
-
将对象存储在HashSet之前,要确保重写hashCode()方法和equals()方法,这样才能比较对象的值是否相等,确保集合中没有储存相同的对象。
-
HashSet实现Set接口,由哈希表(实际上是一个HashMap实例)支持。
-
在HashSet中,元素都存到HashMap键值对的Key上面,而Value时有一个统一的值private static final Object PRESENT = new Object();
-
当有新值加入时,底层的HashMap会判断Key值是否存在
-
线程非安全的
-
hashSet源码:
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable
{
static final long serialVersionUID = -5024744406713321676L;
// 底层使用HashMap来保存HashSet中所有元素。
private transient HashMap<E,Object> map;
// 定义一个虚拟的Object对象作为HashMap的value,将此对象定义为static final。
private static final Object PRESENT = new Object();
/**
* 默认的无参构造器,构造一个空的HashSet。
*
* 实际底层会初始化一个空的HashMap,并使用默认初始容量为16和加载因子0.75。
*/
public HashSet() {
map = new HashMap<E,Object>();
}
/**
* 构造一个包含指定collection中的元素的新set。
*
* 实际底层使用默认的加载因子0.75和足以包含指定
* collection中所有元素的初始容量来创建一个HashMap。
* @param c 其中的元素将存放在此set中的collection。
*/
public HashSet(Collection<? extends E> c) {
map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16));
addAll(c);
}
/**
* 以指定的initialCapacity和loadFactor构造一个空的HashSet。
*
* 实际底层以相应的参数构造一个空的HashMap。
* @param initialCapacity 初始容量。
* @param loadFactor 加载因子。
*/
public HashSet(int initialCapacity, float loadFactor) {
map = new HashMap<E,Object>(initialCapacity, loadFactor);
}
/**
* 以指定的initialCapacity构造一个空的HashSet。
*
* 实际底层以相应的参数及加载因子loadFactor为0.75构造一个空的HashMap。
* @param initialCapacity 初始容量。
*/
public HashSet(int initialCapacity) {
map = new HashMap<E,Object>(initialCapacity);
}
/**
* 以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。
* 此构造函数为包访问权限,不对外公开,实际只是是对LinkedHashSet的支持。
*
* 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。
* @param initialCapacity 初始容量。
* @param loadFactor 加载因子。
* @param dummy 标记。
*/
HashSet(int initialCapacity, float loadFactor, boolean dummy) {
map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor);
}
/**
* 返回对此set中元素进行迭代的迭代器。返回元素的顺序并不是特定的。
*
* 底层实际调用底层HashMap的keySet来返回所有的key。
* 可见HashSet中的元素,只是存放在了底层HashMap的key上,
* value使用一个static final的Object对象标识。
* @return 对此set中元素进行迭代的Iterator。
*/
public Iterator<E> iterator() {
return map.keySet().iterator();
}
/**
* 返回此set中的元素的数量(set的容量)。
*
* 底层实际调用HashMap的size()方法返回Entry的数量,就得到该Set中元素的个数。
* @return 此set中的元素的数量(set的容量)。
*/
public int size() {
return map.size();
}
/**
* 如果此set不包含任何元素,则返回true。
*
* 底层实际调用HashMap的isEmpty()判断该HashSet是否为空。
* @return 如果此set不包含任何元素,则返回true。
*/
public boolean isEmpty() {
return map.isEmpty();
}
/**
* 如果此set包含指定元素,则返回true。
* 更确切地讲,当且仅当此set包含一个满足(o==null ? e==null : o.equals(e))
* 的e元素时,返回true。
*
* 底层实际调用HashMap的containsKey判断是否包含指定key。
* @param o 在此set中的存在已得到测试的元素。
* @return 如果此set包含指定元素,则返回true。
*/
public boolean contains(Object o) {
return map.containsKey(o);
}
/**
* 如果此set中尚未包含指定元素,则添加指定元素。
* 更确切地讲,如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2))
* 的元素e2,则向此set 添加指定的元素e。
* 如果此set已包含该元素,则该调用不更改set并返回false。
*
* 底层实际将将该元素作为key放入HashMap。
* 由于HashMap的put()方法添加key-value对时,当新放入HashMap的Entry中key
* 与集合中原有Entry的key相同(hashCode()返回值相等,通过equals比较也返回true),
* 新添加的Entry的value会将覆盖原来Entry的value,但key不会有任何改变,
* 因此如果向HashSet中添加一个已经存在的元素时,新添加的集合元素将不会被放入HashMap中,
* 原来的元素也不会有任何改变,这也就满足了Set中元素不重复的特性。
* @param e 将添加到此set中的元素。
* @return 如果此set尚未包含指定元素,则返回true。
*/
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
/**
* 如果指定元素存在于此set中,则将其移除。
* 更确切地讲,如果此set包含一个满足(o==null ? e==null : o.equals(e))的元素e,
* 则将其移除。如果此set已包含该元素,则返回true
* (或者:如果此set因调用而发生更改,则返回true)。(一旦调用返回,则此set不再包含该元素)。
*
* 底层实际调用HashMap的remove方法删除指定Entry。
* @param o 如果存在于此set中则需要将其移除的对象。
* @return 如果set包含指定元素,则返回true。
*/
public boolean remove(Object o) {
return map.remove(o)==PRESENT;
}
/**
* 从此set中移除所有元素。此调用返回后,该set将为空。
*
* 底层实际调用HashMap的clear方法清空Entry中所有元素。
*/
public void clear() {
map.clear();
}
/**
* 返回此HashSet实例的浅表副本:并没有复制这些元素本身。
*
* 底层实际调用HashMap的clone()方法,获取HashMap的浅表副本,并设置到HashSet中。
*/
public Object clone() {
try {
HashSet<E> newSet = (HashSet<E>) super.clone();
newSet.map = (HashMap<E, Object>) map.clone();
return newSet;
} catch (CloneNotSupportedException e) {
throw new InternalError();
}
}
}
TreeSet(二叉树):
特点:
元素有序,这里的顺序不是值存储和取出的顺序,而是按照一定的规则进行排序,具体排序的方式取决于构造方法。
- TreeSet():根据其元素的自然排序进行排序
- TreeSet(Comparator compartor):根据指定的比较器进行排序。
(1)底层原理:
TreeSet实现了继承于Set接口的SortedSet接口,支持自然排序和定制排序,
(2)无序且可排序(自然排序)、不可重复的,无索引,查询快。
(3)没有带索引,不能使用普通for循环比遍历
使用场景:
需要排序时使用。
HashSet和TreeSet的区别
49.HashSet和TreeSet有什么区别?
相同点:1、单列存储 2、元素不可重复
不同点:1、底层数据结构不同(HashSet=哈希表结构 TreeSet=二叉树结构)
2、数据唯一性依据不同(HashSet通过重写hashcode和equals TreeSet通过compareable接口)
3、有序性不同,HashSet无序,TreeSet有序
LinkedHashSet:E表示集合中存储的元素类型
- 特点:
- (1)底层原理:作为HashSet的子类,比它多了一条链表,这条链用来记录元素顺序。哈希表和链表实现Set接口。
- (2)有序的(按输入的顺序排序由链表保证)、不可重复的(有哈希表保证),无索引、查询快
package com.guoba.day1215.arraylist.Demo;
import java.util.HashSet;
import java.util.LinkedHashSet;
/*
需求:
创建一个储存学生对象的集合,储存三个学生对象,
使用程序实现在控制台遍历集合
要求:
学生对象的成员变量相同,我们就认为是同一个对象
思路:
1.定义学生类
2.创建hashset集合对象
3.创建学生对象
4.把学生添加到集合
5.遍历集合(增强for循环实现)
6.在学生类中重写两个方法equals和hashcode
*/
public class LinkedHashSetDemo {
public static void main(String[] args) {
Student student1 = new Student("张三",18);
Student student2 = new Student("李四",19);
Student student3 = new Student("张三",18);
LinkedHashSet<Student> linkedHashSet = new LinkedHashSet<Student>();
linkedHashSet.add(student1);
linkedHashSet.add(student2);
linkedHashSet.add(student3);
for (Student s : linkedHashSet) {
System.out.println(s.toString());//需要重写hashcode和equals
}
}
}
package com.guoba.day1215.arraylist.Demo;
public class Student {
private String name;
private int age;
public Student() {
}
public Student(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
if (age != student.age) return false;
return name != null ? name.equals(student.name) : student.name == null;
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}
@Override
public String toString() {
return "姓名:" + name + "\t" +
"年龄:" + age;
}
}
并发修改异常
- ConcurrentModfication
- 产生原因
- 迭代器遍历过程中,通过集合对象修改了集合中的元素长度,造成了迭代器元素 中判断预期修改值和实际修改值不一致。
- 解决方案
- 用for循环遍历,然后用集合对象做对应的操作即可
常见数据结构之栈
- 数据进入栈模型的过程称为:压/进栈
- 数据离开栈模型的过程称为:弹/出栈
- 栈是一种数据先进后出的模型
常见的数据结构之队列
- 数据从后端进入队列的模型称为:入队列
- 数据从前端离开队列模型的过程称为:出队列
常见的数据结构之数组
- 查询数据通过索引定位
- 查询任意数据耗时相同
- 查询效率高
- 删除数据时,要将原始数据删除,
- 同时后面每个数据迁移,
- 删除效率低
- 添加数据时,添加位置后的每个数据前移,
- 添加效率极低
双向链表
2.4泛型
2.5Map
HashMap
键值对形式存数据。
用法:
(1)存值:put(key,value);
(2)获取所有键:keySet();
(3)通过键获取值get(key);
(4)移除整行数据:remove();
(5)集合长度:size();
(6)清空:clear();
步骤:
1.创建Map集合
2.存值map.put();
3.Set keys = map.keySet();//获取所有键
4.Iterator
Set<Map.Entry<Key,Value>> entrySet();//Map接口方法
特点:
1.用于存储映射关系数据
2.键值对(key,value)形式存储
3.key值不重复,value可重复,且可为null;
4.不保存基本类型数据,存对象。
5.是顶级接口,与Collection是不同体系
使用场景:
适用于Map中插入,删除和定位元素
hashTable
- key不可重复,value可重复
- 底层哈希表
- key和value均不能为null
hashMap和hashTable的区别
- 1.hashmap允许出现空值
- 2.线程异步,效率较高
- 继承自AbstarctMap
- 1.hashtable不允许出现空值,空键
- 2.线程同步,效率低
TreeMap
特点
(1)key不可重复,value可重复
(2)底层二叉树
使用场景:
- 适用于按自然是内需或自定义顺序遍历键(key)
哈希表
哈希表
- 底层采用数组+链表实现,可以说视一个元素为链表的数组。
- 原理:先将要存的数据计算哈希值,若哈希表为初始化,则先初始化,
- 然后用哈希值对数组长度取余,取余得到的值就是要存储的数组的位置。
- 然后判断此位置是否存在元素,若存在则比较哈希值,
- 哈希值不同则存储,若不存在元素,则直接存储。
- 若哈希值不同则用equals判断,若字符串内容相同,
- 则不存储,若不同则存储。
- 从而确保了存储元素的唯一性。
案例:hashset集合储存学生对象并遍历
package com.guoba.day1215.arraylist.Demo;
import java.util.HashSet;
/*
需求:
创建一个储存学生对象的集合,储存三个学生对象,
使用程序实现在控制台遍历集合
要求:
学生对象的成员变量相同,我们就认为是同一个对象
思路:
1.定义学生类
2.创建hashset集合对象
3.创建学生对象
4.把学生添加到集合
5.遍历集合(增强for循环实现)
6.在学生类中重写两个方法equals和hashcode
*/
public class HashSetDemo {
public static void main(String[] args) {
HashSet<Student> hashSet = new HashSet<Student>();
Student student1 = new Student("张三",18);
Student student2 = new Student("李四",19);
Student student3 = new Student("张三",18);
hashSet.add(student1);
hashSet.add(student2);
hashSet.add(student3);
for (Student s : hashSet) {
System.out.println(s.getName()+s.getAge());//需要重写hashcode和equals
// System.out.println(s);
}
}
}
package com.guoba.day1215.arraylist.Demo;
/*
学生类
*/
public class Student {
private String name;
private int age;
public Student() {
}
public Student(String name, int age) {
this.name = name;
this.age = age;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public int getAge() {
return age;
}
public void setAge(int age) {
this.age = age;
}
@Override
public boolean equals(Object o) {
if (this == o) return true;
if (o == null || getClass() != o.getClass()) return false;
Student student = (Student) o;
if (age != student.age) return false;
return name != null ? name.equals(student.name) : student.name == null;
}
@Override
public int hashCode() {
int result = name != null ? name.hashCode() : 0;
result = 31 * result + age;
return result;
}
}
总结:
- 所有Java集合类都位于java.utils包中,,与Java数组不同,Java集合不能存放基本数据类型,而只能存放对象
- Java集合类主要由两个接口派生而出,即Collection和Map接口。Collection和Map都是Java集合最顶层的父接口,这两个接口包含其他的子接口和实现类。
- List集合代表一个元素是有序的、且可以重复的、可以为null的集合。可以通过get(int index)取出下标为index的元素。
- List最常见的实现类是ArrayList和LinkedList。
- 当对集合元素进行频繁的读取操作时,使用ArrayList效率比较高
- 当对集合元素进行频繁增删操作时,用LinkedList效率比较高
- Set集合不允许包含相同的元素,Set的排列顺序可能与添加顺序不同,set元素值可以为NUll,
- hashSet是Set接口的常用实现类,可以通过重写equals和hashcode方法定义对象相等逻辑。
- Iterator迭代器提供了遍历集合Collection元素的统一接口。
- Map用于保存具有映射关系的数据。Map集合中保留着两组值,一组值用于保存Map里的Key,另外一组值保存Map的Value。且Key和Value可以为Null;
- Map接口的put用于添加一对键值对,用get返回键值对。