常用集合类简介及线程安全和非线程安全的集合对象
简介
Java中集合类有很多,只介绍常用的集合类:
线程安全和非线程安全的集合对象
一、概念:
- 线程安全:就是当多线程访问时,采用了加锁的机制;即当一个线程访问该类的某个数据时,会对这个数据进行保护,其他线程不能对其访问,直到该线程读取完之后,其他线程才可以使用。防止出现数据不一致或者数据被污染的情况。
- 线程不安全:就是不提供数据访问时的数据保护,多个线程能够同时操作某个数据,从而出现数据不一致或者数据污染的情况。
- 对于线程不安全的问题,一般会使用synchronized关键字加锁同步控制。
- 线程安全工作原理: jvm中有一个main memory对象,每一个线程也有自己的working memory,一个线程对于一个变量variable进行操作的时候, 都需要在自己的working memory里创建一个copy,操作完之后再写入main memory。 当多个线程操作同一个变量variable,就可能出现不可预知的结果。
而用synchronized的关键是建立一个监控monitor,这个monitor可以是要修改的变量,也可以是其他自己认为合适的对象(方法),然后通过给这个monitor加锁来实现线程安全,每个线程在获得这个锁之后,要执行完加载load到working memory 到 use && 指派assign 到 存储store 再到 main memory的过程。才会释放它得到的锁。这样就实现了所谓的线程安全。
二、线程安全(Thread-safe)的集合对象:
- Vector 线程安全:
- HashTable 线程安全:
- StringBuffer 线程安全:
三、非线程安全的集合对象:
- ArrayList :
- LinkedList:
- HashMap:
- HashSet:
- TreeMap:
- TreeSet:
- StringBulider:
四、相关集合对象比较:
Vector、ArrayList、LinkedList:
1、Vector:
Vector与ArrayList一样,也是通过数组实现的,不同的是它支持线程的同步,即某一时刻只有一个线程能够写Vector,避免多线程同时写而引起的不一致性,但实现同步需要很高的花费,因此,访问它比访问ArrayList慢。
2、ArrayList:
a. 当操作是在一列数据的后面添加数据而不是在前面或者中间,并需要随机地访问其中的元素时,使用ArrayList性能比较好。
b.
ArrayList是最常用的List实现类,内部是通过数组实现的,它允许对元素进行快速随机访问。数组的缺点是每个元素之间不能有间隔,当数组大小不满足时需要增加存储能力,就要讲已经有数组的数据复制到新的存储空间中。当从ArrayList的中间位置插入或者删除元素时,需要对数组进行复制、移动、代价比较高。因此,它适合随机查找和遍历,不适合插入和删除。
3、LinkedList:
a. 当对一列数据的前面或者中间执行添加或者删除操作时,并且按照顺序访问其中的元素时,要使用LinkedList。
b. LinkedList是用链表结构存储数据的,很适合数据的动态插入和删除,随机访问和遍历速度比较慢。另外,他还提供了List接口中没有定义的方法,专门用于操作表头和表尾元素,可以当作堆栈、队列和双向队列使用。
Vector和ArrayList在使用上非常相似,都可以用来表示一组数量可变的对象应用的集合,并且可以随机的访问其中的元素。
ArryList和LinkedList的区别:
Vector与ArrayList比较:
1. 性能上
ArrayList底层数据结构是数组,适合随机查找和遍历,不适合插入和删除,线程不安全,效率高。。LinkedList底层数据结构是链表, 适合数据的动态插入和删除,随机访问和遍历速度比较慢,线程不安全,效率高。。
HashTable、HashMap、HashSet:
HashTable和HashMap采用的存储机制是一样的,不同的是:
1、HashMap:
a. 采用数组方式存储key-value构成的Entry对象,无容量限制;
b. 基于key hash查找Entry对象存放到数组的位置,对于hash冲突采用链表的方式去解决;
c. 在插入元素时,可能会扩大数组的容量,在扩大容量时须要重新计算hash,并复制对象到新的数组中;
d. 是非线程安全的;
e. 遍历使用的是Iterator迭代器;
2、HashTable:
a. 是线程安全的;
b. 无论是key还是value都不允许有null值的存在;在HashTable中调用Put方法时,如果key为null,直接抛出NullPointerException异常;
c. 遍历使用的是Enumeration列举;
3、HashSet:
a. 基于HashMap实现,无容量限制;
b. 是非线程安全的;
c. 不保证数据的有序;
TreeSet、TreeMap:
TreeSet和TreeMap都是完全基于Map来实现的,并且都不支持get(index)来获取指定位置的元素,需要遍历来获取。另外,TreeSet还提供了一些排序方面的支持,例如传入Comparator实现、descendingSet以及descendingIterator等。
1、TreeSet:
a. 基于TreeMap实现的,支持排序;
b. 是非线程安全的;
2、TreeMap:
a. 典型的基于红黑树的Map实现,因此它要求一定要有key比较的方法,要么传入Comparator比较器实现,要么key对象实现Comparator接口;
b. 是非线程安全的;
Collection有两个子接口:List和Set,二者主要区别在于:list数据有序存放、可重复;set中数据无序存放,不可重复。
Vector
Vector类实现了一个动态数组,主要用在事先不知道数组的大小,以及需要频繁地进行查找,插入,删除工作,或者只是需要一个可以改变大小的数组的情况。
创建:
Vector类支持4种构造方法。
第一种构造方法创建一个默认的向量,默认大小为10:
Vector()
第二种构造方法创建指定大小的向量。
Vector(int size)
第三种构造方法创建指定大小的向量,并且增量用incr指定. 增量表示向量每次增加的元素数目(当该vector对象添加的元素接近原先分配的内存极限时,会以incr大小自动扩大该对象拥有的内存容量,以容纳更多的数据)
Vector(int size,int incr)
第四中构造方法创建一个包含集合c元素的向量:利用父类对象创建子类对象
Vector(Collection c)
常用的vector操作方法:增、删、查、改。
增:
vec.add(E element)
将指定元素追加到此向量的末尾。
vec.add(int index, E element)
在此向量的指定位置插入指定的元素。
vec.addAll(Collection c)
将指定 Collection 中的所有元素按顺序追加到此向量的末尾。
vec.addAll(int index, Collection c)
在指定位置将指定 Collection 中的所有元素插入到此向量中。
删:
vec.remove(int index)
移除此向量中指定位置的元素。
vec.remove(value v)
移除向量中元素值为v的元素。
vec.removeAll(Collection c)
从此向量中移除包含在集合c 中的所有元素。
vec.removeAllElements()
从此向量中移除全部组件,并将其大小设置为零。
vec.removeRange(int fromIndex, int toIndex)
移除位于 fromIndex(包括)与 toIndex(不包括)之间的所有元素。
vec.clear() 移除所有元素。
查:
vec.get(int index)
返回向量中指定位置的元素。
vex.indexOf(value v)
返回v值在vec中的下标。
vec.isEmpty()
检查该向量是否为空。
vec.lastElement()
返回此向量的最后一个元素。
int capacity()
返回此向量的当前容量。
int size()
返回此向量中的组件数。
String toString()
返回此向量的字符串表示形式,其中包含每个元素的 String 表示形式。
改:
vec.set(int index, E element)
用指定的元素替换此向量中指定位置处的元素。
vex.setElementAt(E obj, int index)
将此向量指定 index 处的组件设置为指定的对象。
vec.setSize(int newSize)
设置此向量的大小。
ArrayList
ArrayList就是动态的数组,可以动态的增加和减少元素,灵活的设置数组的大小。基本与Vector一样。
创建:
ArrayList提供了三个构造器:
public ArrayList();
默认的构造器,将会以默认(16)的大小来初始化内部的数组
public ArrayList(Collection c);
用一个集合对象来构造,并将该集合的元素添加到ArrayList
public ArrayList(int n);
用指定n的大小来初始化内部的数组.
增:
方法摘要 | |
---|---|
boolean |
add(E e) 将指定的元素添加到此列表的尾部。 |
void |
add(int index, E element)
将指定的元素插入此列表中的指定位置。 |
boolean |
addAll(Collection<? extends E> c) 按照指定 collection 的迭代器所返回的元素顺序,将该 collection 中的所有元素添加到此列表的尾部。 |
boolean |
addAll(int index,
Collection<? extends E> c)
从指定的位置开始,将指定 collection 中的所有元素插入到此列表中。 |
删:
E |
remove(int index) 移除此列表中指定位置上的元素。 |
boolean |
remove(Object o)
移除此列表中首次出现的指定元素(如果存在)。 |
protected
void |
removeRange(int fromIndex,
int toIndex) 移除列表中索引在 fromIndex(包括)和 toIndex(不包括)之间的所有元素。 |
void |
clear() 移除此列表中的所有元素。 |
查:
E |
get(int index) 返回此列表中指定位置上的元素。 |
int |
indexOf(Object o)
返回此列表中首次出现的指定元素的索引,或如果此列表不包含元素,则返回 -1。 |
boolean |
isEmpty()
如果此列表中没有元素,则返回 true |
int |
size() 返回此列表中的元素数。 |
boolean |
contains(Object o) 如果此列表中包含指定的元素,则返回 true。 |
ArrayList支持3种遍历方式
第一种,通过迭代器遍历。
Integer value = null; Iterator iter = list.iterator(); while (iter.hasNext()) { value = (Integer)iter.next(); }
第二种,随机访问,通过索引值去遍历。
Integer value = null;for (int i=0; i<list.size(); i++) { value = (Integer)list.get(i); }
第三种,for-each遍历。
Integer value = null; for (Integer integ:list) { value = integ; }
改:
E |
set(int index, E element) 用指定的元素替代此列表中指定位置上的元素。 |
Object[] |
toArray() |
HashMap
这里我们先讲hashmap,具体原因等讲到hashset的时候就知道了。
构造方法摘要 | |
---|---|
HashMap() 构造一个具有默认初始容量 (16) 和默认加载因子 (0.75) 的空 HashMap。 |
|
HashMap(int initialCapacity) 构造一个带指定初始容量和默认加载因子 (0.75) 的空 HashMap。 |
|
HashMap(int initialCapacity, float loadFactor) 构造一个带指定初始容量和加载因子的空 HashMap。 |
|
HashMap(Map<? extends K,? extends V> m) 构造一个映射关系与指定 Map 相同的 HashMap。 |
void |
|
查:
boolean |
isEmpty() 如果此映射不包含键-值映射关系,则返回 true。 |
Set<K> |
keySet() 返回此映射中所包含的键的 set 。//获取hashmap中的key集合。 |
Collection<V> |
values() 返回此映射所包含的值的 collection 视图。 |
int |
size() 返回此映射中的键-值映射关系数。 |
boolean |
containsKey(Object key) 如果此映射包含对于指定的键的映射关系,则返回 true。 |
boolean |
containsValue(Object value) 如果此映射将一个或多个键映射到指定值,则返回 true。 |
HashSet
删除一个元素:hashSet.remove(Object);
删除所有元素:hashSet.clear();
查:
用迭代器遍历:
Iterator it = hashSet.iterator();
while(it.hasNext()){
Object obj = it.next();
然后针对obj进行一系列的操作,比如:输出值、如果obj是类对象则调用属性、方法。
}
boolean |
contains(Object o) 如果此 set 包含指定元素,则返回 true。 |
boolean |
isEmpty()
如果此 set 不包含任何元素,则返回 true。 |
int |
size() 返回此 set 中的元素的数量(set 的容量)。 |
当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。 为了保证HashSet能正常工作,要求当两个对象用equals比较相等时,hashCode也要相等,否则就会有可能加入两个相同的项。
HashSet的特点:
(1)HashSet不是同步的,多个线程访问是需要通过代码保证同步
(2)集合元素值可以为null。