最全的集合笔记(干货)
1.集合基础
1.1集合概述
集合类的特点:提供一种存储空间可变的存储模型,泛型。
ArrayList:
- 可调整大小的数组实现
是一种特殊的数据类型,泛型。
怎么用:
- 在出现E的地方使用引用数据类型替换即可
- 例:ArrayList
,ArrayList
1.2ArrayList构造方法和添加方法
- public ArrayList() 创建一个空的集合对象
- public boolean add(E e) 将指定的元素追加到此集合的末尾
- public void add(int index,E element) 在此集合的指定位置插入指定元素
- Demo01.java
package com.guoba.day1215.arraylist; import java.util.ArrayList; public class Demo01 { public static void main(String[] args) { ArrayList<String> arrayList = new ArrayList<String>(); //添加元素 arrayList.add("hello");//0 arrayList.add("arraylist");//1 arrayList.add("good happy");//2 //arrayList.remove("hello"); //arrayList.set(2,"javase"); System.out.println(arrayList.get(0)); System.out.println(arrayList.get(1)); System.out.println(arrayList.get(2)); //System.out.println(arrayList.get(3));//IndexOutOfBoundsException //System.out.println(arrayList.size()); System.out.println(arrayList); } }
1.3ArrayList集合常用方法
- public boolean remove(Obiject o) 删除指定元素,返回删除是否成功
- public E remove(int index) 删除指定索引初的元素,返回被删除的元素
- public E set(int index,E element) 修改......
- public E get(int index) 返回指定索引处的元素
- public int size() 返回集合元素的个数(类似length)
- Demo_BianLiStudent.java
package com.guoba.studentinformationmanagement; /* 学生类 */ public class Student { private int id; private String name; private String sex; private int fraction;//分数 public Student() { } public Student(int id, String name, String sex, int fraction) { this.id = id; this.name = name; this.sex = sex; this.fraction = fraction; } public int getId() { return id; } public void setId(int id) { this.id = id; } public String getName() { return name; } public void setName(String name) { this.name = name; } public String getSex() { return sex; } public void setSex(String sex) { this.sex = sex; } public int getFraction() { return fraction; } public void setFraction(int fraction) { this.fraction = fraction; } @Override public String toString() { return "Student{" + "id=" + id + ", name='" + name + '\'' + ", sex='" + sex + '\'' + ", fraction=" + fraction + '}'; } }
package com.guoba.day1215.arraylist; import com.guoba.studentinformationmanagement.Student; import java.util.ArrayList; public class Demo_BianLiStudent { public static void main(String[] args) { //创建集合对象 ArrayList<Student> as = new ArrayList<>(3); //创建学生对象,并添加学生信息 Student student1 = new Student(1,"刘备","男",90); Student student2 = new Student(2,"张飞","男",89); Student student3 = new Student(3,"关羽","男",96); //为集合添加学生对象 as.add(student1); as.add(student2); as.add(student3); //循环遍历集合对象 for (int i = 0; i < as.size(); i++) { System.out.println(as.get(i).getId()+as.get(i).getName()+as.get(i).getSex()+as.get(i).getFraction()); } } }
1.4Arraylist特点
- (1)底层使用数组,有序可重复
- (2)查询快,增删慢
- (3)线程不安全,运行速度快
1.5使用场景:
- 当需要对数据进行遍历访问的情况下选用Array List
2.集合进阶
2.1Collection(单列)
Collection集合概述和使用
- 集合概述
- 是单列集合的顶层接口,它表示一组对象,这些对象也称为Cellction的元素
- JDK不提供此接口的任何实现,它提供更具体的子接口(如Set和List)实现
- 创建Cellection集合的对象
- 多态的方式
- 具体的实现类ArrayList
- 练习
(1)回顾
- 特点
- 提供一种储存空间可变的储存模型,储存的数据容量可以随时发生改变
(2)体系结构
List
- 元素是有序的、可重复,可以对列表中每个元素的插入位置进行精确地控制。
- 是一个有序容器,保持了每个元素的插入顺序,输出的顺序就是插入的顺序。
- 常用的实现类有 ArrayList、LinkedList 和 Vector。
2.2List
List接口的实现类
ArrayList
用法:
1.添加元素:add()
2.删除元素:remove()
3.清空元素:clear()
4.集合长度:size()
步骤:
1.List
2.添加元素
3.for循环遍历
for(int i = 0;i<list.size();i++){ System.out.println(list.get(i)); }
特点:
(1)底层使用数组,有序、可重复
(2)查询快,增删慢
(3)线程不安全,运行速度快
使用场景
当需要对数据进行遍历访问的情况下用ArrayList
- ArrayList底层使用了Object的数组作为容器去存储数据
- ArrayList 提供了使用索引的随意访问数据
- ArrayList 是线程非安全的,效率较高,查询速度高
LinkedList
特点:
- LinkedList底层使用了链表的数据结构
- LinkedList随机位置插入、删除数据时比线性表快,遍历比线性表慢。
- 相对于ArrayList,LinkedList 对于经常需要从 List 中添加或删除元素的场合更为合适。
- 和LinkedList一样,ArrayList也是非同步的(unsynchronized)
- 查询慢,增删快
- 线程不安全,运行速度快
用法:
- 起始位置添加元素:addFirst();
- 末尾位置添加元素:addLast();
- 删除起始位置元素:removeFirst();
- 删除末尾位置元素:removeLast();
步骤:
1.创建LinkedList集合
2.添加元素add()
3.foreach遍历/迭代器
使用场景:
对数据进行多次增删和修改时采用LinkedList。
LinkedList和ArrayList集合的区别
- ArrayList:底层原理数组,有序可重复,有索引,长度可变,增删慢,查询快。
- LinkedList:底层是链表,无下标,增删快,查询慢
Vector
- Vector非常类似ArrayList,但是Vector是同步的,效率相对比较低
- Vector的底层结构也是数组,但是它们对数组的扩容方式不同
- 查询快,增删慢,效率低,线程安全
- 当Vector或ArrayList中的元素超过它的初始大小时,Vector会将它的容量翻倍,而ArrayList只增加50%的大小,这样ArrayList就有利于节约内存空间。
即Vector增长原来的一倍,ArrayList增加原来的0.5倍。
Stack栈继承于Vector,栈的存储特点是后进先出,
它基于动态数组实现的一个线程安全的栈,所以栈是线程安全的。
Set
- 元素无序的、不可重复。
- 无序容器,你无法保证每个元素的存储顺序,但是其中的TreeSet是特别的,TreeSet通过 Comparator 或者 Comparable 维护了一个排序顺序。
- 取出元素的方法只有迭代器和增强型for。
- 只允许一个 null 元素
- Set 接口最流行的几个实现类是 HashSet、LinkedHashSet 以及 TreeSet。
- Set和Map的底层联系密切,可以说想要了解Set直接先了解好Map即可
- Set说白了就是对Map的功能的限制
HashSet
用法:
- 是否有下一个:hasNext();
- 有下一个:next();
- 删除:remove();
- hashcode();判断哈希码值相等
- equals(); 判断两个对象
特点:
(1)底层使用hashtable,无序不可重复
(2)无下标,没有get方法,遍历只能iterator
(3)线程不安全,运行速度快
使用场景
快速查找。
概述:
-
HashSet底层实现其实是HashMap(看源码可以知道)
-
HashSet实现了Set接口,它不允许集合中出现重复元素。
-
将对象存储在HashSet之前,要确保重写hashCode()方法和equals()方法,这样才能比较对象的值是否相等,确保集合中没有储存相同的对象。
-
HashSet实现Set接口,由哈希表(实际上是一个HashMap实例)支持。
-
在HashSet中,元素都存到HashMap键值对的Key上面,而Value时有一个统一的值private static final Object PRESENT = new Object();
-
当有新值加入时,底层的HashMap会判断Key值是否存在
-
线程非安全的
-
hashSet源码:
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable { static final long serialVersionUID = -5024744406713321676L; // 底层使用HashMap来保存HashSet中所有元素。 private transient HashMap<E,Object> map; // 定义一个虚拟的Object对象作为HashMap的value,将此对象定义为static final。 private static final Object PRESENT = new Object(); /** * 默认的无参构造器,构造一个空的HashSet。 * * 实际底层会初始化一个空的HashMap,并使用默认初始容量为16和加载因子0.75。 */ public HashSet() { map = new HashMap<E,Object>(); } /** * 构造一个包含指定collection中的元素的新set。 * * 实际底层使用默认的加载因子0.75和足以包含指定 * collection中所有元素的初始容量来创建一个HashMap。 * @param c 其中的元素将存放在此set中的collection。 */ public HashSet(Collection<? extends E> c) { map = new HashMap<E,Object>(Math.max((int) (c.size()/.75f) + 1, 16)); addAll(c); } /** * 以指定的initialCapacity和loadFactor构造一个空的HashSet。 * * 实际底层以相应的参数构造一个空的HashMap。 * @param initialCapacity 初始容量。 * @param loadFactor 加载因子。 */ public HashSet(int initialCapacity, float loadFactor) { map = new HashMap<E,Object>(initialCapacity, loadFactor); } /** * 以指定的initialCapacity构造一个空的HashSet。 * * 实际底层以相应的参数及加载因子loadFactor为0.75构造一个空的HashMap。 * @param initialCapacity 初始容量。 */ public HashSet(int initialCapacity) { map = new HashMap<E,Object>(initialCapacity); } /** * 以指定的initialCapacity和loadFactor构造一个新的空链接哈希集合。 * 此构造函数为包访问权限,不对外公开,实际只是是对LinkedHashSet的支持。 * * 实际底层会以指定的参数构造一个空LinkedHashMap实例来实现。 * @param initialCapacity 初始容量。 * @param loadFactor 加载因子。 * @param dummy 标记。 */ HashSet(int initialCapacity, float loadFactor, boolean dummy) { map = new LinkedHashMap<E,Object>(initialCapacity, loadFactor); } /** * 返回对此set中元素进行迭代的迭代器。返回元素的顺序并不是特定的。 * * 底层实际调用底层HashMap的keySet来返回所有的key。 * 可见HashSet中的元素,只是存放在了底层HashMap的key上, * value使用一个static final的Object对象标识。 * @return 对此set中元素进行迭代的Iterator。 */ public Iterator<E> iterator() { return map.keySet().iterator(); } /** * 返回此set中的元素的数量(set的容量)。 * * 底层实际调用HashMap的size()方法返回Entry的数量,就得到该Set中元素的个数。 * @return 此set中的元素的数量(set的容量)。 */ public int size() { return map.size(); } /** * 如果此set不包含任何元素,则返回true。 * * 底层实际调用HashMap的isEmpty()判断该HashSet是否为空。 * @return 如果此set不包含任何元素,则返回true。 */ public boolean isEmpty() { return map.isEmpty(); } /** * 如果此set包含指定元素,则返回true。 * 更确切地讲,当且仅当此set包含一个满足(o==null ? e==null : o.equals(e)) * 的e元素时,返回true。 * * 底层实际调用HashMap的containsKey判断是否包含指定key。 * @param o 在此set中的存在已得到测试的元素。 * @return 如果此set包含指定元素,则返回true。 */ public boolean contains(Object o) { return map.containsKey(o); } /** * 如果此set中尚未包含指定元素,则添加指定元素。 * 更确切地讲,如果此 set 没有包含满足(e==null ? e2==null : e.equals(e2)) * 的元素e2,则向此set 添加指定的元素e。 * 如果此set已包含该元素,则该调用不更改set并返回false。 * * 底层实际将将该元素作为key放入HashMap。 * 由于HashMap的put()方法添加key-value对时,当新放入HashMap的Entry中key * 与集合中原有Entry的key相同(hashCode()返回值相等,通过equals比较也返回true), * 新添加的Entry的value会将覆盖原来Entry的value,但key不会有任何改变, * 因此如果向HashSet中添加一个已经存在的元素时,新添加的集合元素将不会被放入HashMap中, * 原来的元素也不会有任何改变,这也就满足了Set中元素不重复的特性。 * @param e 将添加到此set中的元素。 * @return 如果此set尚未包含指定元素,则返回true。 */ public boolean add(E e) { return map.put(e, PRESENT)==null; } /** * 如果指定元素存在于此set中,则将其移除。 * 更确切地讲,如果此set包含一个满足(o==null ? e==null : o.equals(e))的元素e, * 则将其移除。如果此set已包含该元素,则返回true * (或者:如果此set因调用而发生更改,则返回true)。(一旦调用返回,则此set不再包含该元素)。 * * 底层实际调用HashMap的remove方法删除指定Entry。 * @param o 如果存在于此set中则需要将其移除的对象。 * @return 如果set包含指定元素,则返回true。 */ public boolean remove(Object o) { return map.remove(o)==PRESENT; } /** * 从此set中移除所有元素。此调用返回后,该set将为空。 * * 底层实际调用HashMap的clear方法清空Entry中所有元素。 */ public void clear() { map.clear(); } /** * 返回此HashSet实例的浅表副本:并没有复制这些元素本身。 * * 底层实际调用HashMap的clone()方法,获取HashMap的浅表副本,并设置到HashSet中。 */ public Object clone() { try { HashSet<E> newSet = (HashSet<E>) super.clone(); newSet.map = (HashMap<E, Object>) map.clone(); return newSet; } catch (CloneNotSupportedException e) { throw new InternalError(); } } }
TreeSet(二叉树):
特点:
元素有序,这里的顺序不是值存储和取出的顺序,而是按照一定的规则进行排序,具体排序的方式取决于构造方法。
- TreeSet():根据其元素的自然排序进行排序
- TreeSet(Comparator compartor):根据指定的比较器进行排序。
(1)底层原理:
TreeSet实现了继承于Set接口的SortedSet接口,支持自然排序和定制排序,
(2)无序且可排序(自然排序)、不可重复的,无索引,查询快。
(3)没有带索引,不能使用普通for循环比遍历
使用场景:
需要排序时使用。
HashSet和TreeSet的区别
49.HashSet和TreeSet有什么区别?
相同点:1、单列存储 2、元素不可重复
不同点:1、底层数据结构不同(HashSet=哈希表结构 TreeSet=二叉树结构)
2、数据唯一性依据不同(HashSet通过重写hashcode和equals TreeSet通过compareable接口)
3、有序性不同,HashSet无序,TreeSet有序
LinkedHashSet:E表示集合中存储的元素类型
- 特点:
- (1)底层原理:作为HashSet的子类,比它多了一条链表,这条链用来记录元素顺序。哈希表和链表实现Set接口。
- (2)有序的(按输入的顺序排序由链表保证)、不可重复的(有哈希表保证),无索引、查询快
package com.guoba.day1215.arraylist.Demo; import java.util.HashSet; import java.util.LinkedHashSet; /* 需求: 创建一个储存学生对象的集合,储存三个学生对象, 使用程序实现在控制台遍历集合 要求: 学生对象的成员变量相同,我们就认为是同一个对象 思路: 1.定义学生类 2.创建hashset集合对象 3.创建学生对象 4.把学生添加到集合 5.遍历集合(增强for循环实现) 6.在学生类中重写两个方法equals和hashcode */ public class LinkedHashSetDemo { public static void main(String[] args) { Student student1 = new Student("张三",18); Student student2 = new Student("李四",19); Student student3 = new Student("张三",18); LinkedHashSet<Student> linkedHashSet = new LinkedHashSet<Student>(); linkedHashSet.add(student1); linkedHashSet.add(student2); linkedHashSet.add(student3); for (Student s : linkedHashSet) { System.out.println(s.toString());//需要重写hashcode和equals } } }
package com.guoba.day1215.arraylist.Demo; public class Student { private String name; private int age; public Student() { } public Student(String name, int age) { this.name = name; this.age = age; } public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Student student = (Student) o; if (age != student.age) return false; return name != null ? name.equals(student.name) : student.name == null; } @Override public int hashCode() { int result = name != null ? name.hashCode() : 0; result = 31 * result + age; return result; } @Override public String toString() { return "姓名:" + name + "\t" + "年龄:" + age; } }
并发修改异常
- ConcurrentModfication
- 产生原因
- 迭代器遍历过程中,通过集合对象修改了集合中的元素长度,造成了迭代器元素 中判断预期修改值和实际修改值不一致。
- 解决方案
- 用for循环遍历,然后用集合对象做对应的操作即可
常见数据结构之栈
- 数据进入栈模型的过程称为:压/进栈
- 数据离开栈模型的过程称为:弹/出栈
- 栈是一种数据先进后出的模型
常见的数据结构之队列
- 数据从后端进入队列的模型称为:入队列
- 数据从前端离开队列模型的过程称为:出队列
常见的数据结构之数组
- 查询数据通过索引定位
- 查询任意数据耗时相同
- 查询效率高
- 删除数据时,要将原始数据删除,
- 同时后面每个数据迁移,
- 删除效率低
- 添加数据时,添加位置后的每个数据前移,
- 添加效率极低
双向链表
2.4泛型
2.5Map
HashMap
键值对形式存数据。
用法:
(1)存值:put(key,value);
(2)获取所有键:keySet();
(3)通过键获取值get(key);
(4)移除整行数据:remove();
(5)集合长度:size();
(6)清空:clear();
步骤:
1.创建Map集合
2.存值map.put();
3.Set keys = map.keySet();//获取所有键
4.Iterator
Set<Map.Entry<Key,Value>> entrySet();//Map接口方法
特点:
1.用于存储映射关系数据
2.键值对(key,value)形式存储
3.key值不重复,value可重复,且可为null;
4.不保存基本类型数据,存对象。
5.是顶级接口,与Collection是不同体系
使用场景:
适用于Map中插入,删除和定位元素
hashTable
- key不可重复,value可重复
- 底层哈希表
- key和value均不能为null
hashMap和hashTable的区别
- 1.hashmap允许出现空值
- 2.线程异步,效率较高
- 继承自AbstarctMap
- 1.hashtable不允许出现空值,空键
- 2.线程同步,效率低
TreeMap
特点
(1)key不可重复,value可重复
(2)底层二叉树
使用场景:
- 适用于按自然是内需或自定义顺序遍历键(key)
哈希表
哈希表
- 底层采用数组+链表实现,可以说视一个元素为链表的数组。
- 原理:先将要存的数据计算哈希值,若哈希表为初始化,则先初始化,
- 然后用哈希值对数组长度取余,取余得到的值就是要存储的数组的位置。
- 然后判断此位置是否存在元素,若存在则比较哈希值,
- 哈希值不同则存储,若不存在元素,则直接存储。
- 若哈希值不同则用equals判断,若字符串内容相同,
- 则不存储,若不同则存储。
- 从而确保了存储元素的唯一性。
案例:hashset集合储存学生对象并遍历
package com.guoba.day1215.arraylist.Demo; import java.util.HashSet; /* 需求: 创建一个储存学生对象的集合,储存三个学生对象, 使用程序实现在控制台遍历集合 要求: 学生对象的成员变量相同,我们就认为是同一个对象 思路: 1.定义学生类 2.创建hashset集合对象 3.创建学生对象 4.把学生添加到集合 5.遍历集合(增强for循环实现) 6.在学生类中重写两个方法equals和hashcode */ public class HashSetDemo { public static void main(String[] args) { HashSet<Student> hashSet = new HashSet<Student>(); Student student1 = new Student("张三",18); Student student2 = new Student("李四",19); Student student3 = new Student("张三",18); hashSet.add(student1); hashSet.add(student2); hashSet.add(student3); for (Student s : hashSet) { System.out.println(s.getName()+s.getAge());//需要重写hashcode和equals // System.out.println(s); } } }
package com.guoba.day1215.arraylist.Demo; /* 学生类 */ public class Student { private String name; private int age; public Student() { } public Student(String name, int age) { this.name = name; this.age = age; } public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public void setAge(int age) { this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Student student = (Student) o; if (age != student.age) return false; return name != null ? name.equals(student.name) : student.name == null; } @Override public int hashCode() { int result = name != null ? name.hashCode() : 0; result = 31 * result + age; return result; } }
总结:
- 所有Java集合类都位于java.utils包中,,与Java数组不同,Java集合不能存放基本数据类型,而只能存放对象
- Java集合类主要由两个接口派生而出,即Collection和Map接口。Collection和Map都是Java集合最顶层的父接口,这两个接口包含其他的子接口和实现类。
- List集合代表一个元素是有序的、且可以重复的、可以为null的集合。可以通过get(int index)取出下标为index的元素。
- List最常见的实现类是ArrayList和LinkedList。
- 当对集合元素进行频繁的读取操作时,使用ArrayList效率比较高
- 当对集合元素进行频繁增删操作时,用LinkedList效率比较高
- Set集合不允许包含相同的元素,Set的排列顺序可能与添加顺序不同,set元素值可以为NUll,
- hashSet是Set接口的常用实现类,可以通过重写equals和hashcode方法定义对象相等逻辑。
- Iterator迭代器提供了遍历集合Collection元素的统一接口。
- Map用于保存具有映射关系的数据。Map集合中保留着两组值,一组值用于保存Map里的Key,另外一组值保存Map的Value。且Key和Value可以为Null;
- Map接口的put用于添加一对键值对,用get返回键值对。