多线程编程-之并发编程:同步容器

为了方便编写出线程安全的程序,Java里面提供了一些线程安全类和并发工具,比如:同步容器、并发容器、阻塞队列、Synchronizer。

同时说说List,Set,Map之间的区别. 

自动扩展的数组: List 

重复的数组:set 

自动排序的组数 :TreeSet,TreeList,Tree** 

 

而几乎所有的集合都是基于数组来实现的. 

因为集合是对数组做的封装,所以,数组永远比任何一个集合要快 

但任何一个集合,比数组提供的功能要多 

 

一:数组声明了它容纳的元素的类型,而集合不声明。这是由于集合以object形式来存储它们的元素。 

二:一个数组实例具有固定的大小,不能伸缩。集合则可根据需要动态改变大小。 

三:数组是一种可读/可写数据结构---没有办法创建一个只读数组。然而可以使用集合提供的ReadOnly方法,以只读方式来使用集合。该方法将返回一个集合的只读版本.

一.为什么会出现同步容器?

 在Java的集合容器框架中,主要有四大类别:List、Set、Queue、Map。

List、Set、Queue接口分别继承了Collection接口,Map本身是一个接口。

Collection和Map是一个顶层接口,而List、Set、Queue则继承了Collection接口,分别代表数组、集合和队列这三大类容器。

  像ArrayList、LinkedList都是实现了List接口,HashSet实现了Set接口,而Deque(双向队列,允许在队首、队尾进行入队和出队操作)继承了Queue接口,PriorityQueue实现了Queue接口。另外LinkedList(实际上是双向链表)实现了了Deque接口。

  像ArrayList、LinkedList、HashMap这些容器都是非线程安全的。

  如果有多个线程并发地访问这些容器时,就会出现问题。

  因此,在编写程序时,必须要求程序员手动地在任何访问到这些容器的地方进行同步处理,这样导致在使用这些容器的时候非常地不方便。所以,Java提供了同步容器供用户使用。va中的同步容器类

  在Java中,同步容器主要包括3类:

  1)Vector、Stack、HashTable 其他都是在这基础上拓展

     2)Collections类中提供的静态工厂方法创建的类

     3) 并发容器:ConcurrentHashMap, CopyOnWriteArrayList, ConcurrentLinkedQuerue, ConcurrentSkipListMap, ConcurrentSkipListSet

 

ConcurrentHashMap代替同步的Map(Collections.synchronized(new HashMap())),众所周知,HashMap是根据散列值分段存储的,同步Map在同步的时候锁住了所有的段,而ConcurrentHashMap加锁的时候根据散列值锁住了散列值锁对应的那段,因此提高了并发性能。ConcurrentHashMap也增加了对常用复合操作的支持,比如"若没有则添加":putIfAbsent(),替换:replace()。这2个操作都是原子操作。

  CopyOnWriteArrayList和CopyOnWriteArraySet分别代替List和Set,主要是在遍历操作为主的情况下来代替同步的List和同步的Set,这也就是上面所述的思路:迭代过程要保证不出错,除了加锁,另外一种方法就是"克隆"容器对象。

  ConcurrentLinkedQuerue是一个先进先出的队列。它是非阻塞队列。

    ConcurrentSkipListMap可以在高效并发中替代SoredMap(例如用Collections.synchronzedMap包装的TreeMap)。

  ConcurrentSkipListSet可以在高效并发中替代SoredSet(例如用Collections.synchronzedSet包装的TreeMap)。

  Vector实现了List接口,Vector实际上就是一个数组,和ArrayList类似,但是Vector中的方法都是synchronized方法,即进行了同步措施。

  Stack也是一个同步容器,它的方法也用synchronized进行了同步,它实际上是继承于Vector类。

  HashTable实现了Map接口,它和HashMap很相似,但是HashTable进行了同步处理,而HashMap没有。

  Collections类是一个工具提供类,注意,它和Collection不同,Collection是一个顶层的接口。在Collections类中提供了大量的方法,比如对集合或者容器进行排序、查找等操作。最重要的是,在它里面提供了几个静态工厂方法来创建同步容器类,如下图所示:

 

            

从同步容器的具体实现源码可知,同步容器中的方法采用了synchronized进行了同步,那么很显然,这必然会影响到执行性能,另外,同步容器就一定是真正地完全线程安全吗?不一定,这个在下面会讲到。

  我们首先来看一下传统的非同步容器和同步容器的性能差异,我们以ArrayList和Vector为例:

1.性能问题

  我们先通过一个例子看一下Vector和ArrayList在插入数据时性能上的差异:

public static void main(String [] args) throws InterruptedException{
		
		//10万次插入list集合
		new Thread(){
			@Override
			public void run() {
				List<Integer> list=new ArrayList<Integer>();
				long begin=System.currentTimeMillis();
				for(int i=0;i<1000000;i++){
					list.add(i);
				}
				long end=System.currentTimeMillis();
				System.out.println("List插入消耗时间:"+(end-begin)+"ms");
			}
		}.start();
	
		
		//10万次插入Vector线程同步集合
		 new Thread(){
			 @Override
			public void run() {
				 Vector<Integer> v=new Vector<Integer>();
					long begin1=System.currentTimeMillis();
					for(int i=0;i<1000000;i++){
						v.add(i);
					}
					long end1=System.currentTimeMillis();
					System.out.println("Vector插入消耗时间:"+(end1-begin1)+"ms");
			}
		 }.start();
		
		
		 
	}art)+"ms");
        start = System.currentTimeMillis();
        for(int i=0;i<100000;i++)
            vector.add(i);
        end = System.currentTimeMillis();
        System.out.println("Vector进行100000次插入操作耗时:"+(end-start)+"ms");
    }
}

  

 

 

进行同样多的插入操作,Vector的耗时是ArrayList的一多倍,这只是其中的一方面性能问题上的反映。

  另外,由于Vector中的add方法和get方法都进行了同步,因此,在有多个线程进行访问时,如果多个线程都只是进行读取操作,那么每个时刻就只能有一个线程进行读取,其他线程便只能等待,这些线程必须竞争同一把锁。

  因此为了解决同步容器的性能问题,在Java 1.5中提供了并发容器,位于java.util.concurrent目录下,并发容器的相关知识将在下一篇文章中讲述。

    2.同步容器是否是安全的吗?

  也有人认为Vector中的方法都进行了同步处理,那么一定就是线程安全的,事实上这可不一定。看下面这段代码:

public static void main(String[] args) throws InterruptedException {
    	
       
            for(int i=0;i<10;i++)
                vector.add(i);
            
            //开启一个线程删除集合元素
            new Thread(){
                public void run() {
                	
                    for(int i=0;i<vector.size();i++)
                        vector.remove(i);
               
                };
            }.start();
            
            //开启另外一个线程读取集合
            new Thread(){
                public void run() {
	                    for(int i=0;i<vector.size();i++)
	                        vector.get(i);
                	
                };
            }.start();

    }

以下是执行结果:

 

 

正如大家所看到的,这段代码报错了:数组下标越界。

不是说好的,Vector是线程安全的,为什么还会报这个错?很简单,对于Vector,虽然能保证每一个时刻只能有一个线程访问它,但是不排除这种可能:

当某个线程在某个时刻执行这句时:

for(int i=0;i<vector.size();i++)
    vector.get(i);

  

假若此时vector的size方法返回的是10,i的值为9

 然后另外一个线程执行了这句:

for(int i=0;i<vector.size();i++)
    vector.remove(i);

  将下标为9的元素删除了

  那么通过get方法访问下标为9的元素肯定就会出问题了。

  因此为了保证线程安全,必须在方法调用端做额外的同步措施,如下面所示:

public class Test {
    static Vector<Integer> vector = new Vector<Integer>();
    public static void main(String[] args) throws InterruptedException {
        while(true) {
            for(int i=0;i<10;i++)
                vector.add(i);
            Thread thread1 = new Thread(){
                public void run() {
                    synchronized (Test.class) {   //进行额外的同步
                        for(int i=0;i<vector.size();i++)
                            vector.remove(i);
                    }
                };
            };
            Thread thread2 = new Thread(){
                public void run() {
                    synchronized (Test.class) {
                        for(int i=0;i<vector.size();i++)
                            vector.get(i);
                    }
                };
            };
            thread1.start();
            thread2.start();
            while(Thread.activeCount()>10)   {
                 
            }
        }
    }
}

  

 3. ConcurrentModificationException异常

 在对Vector等容器并发地进行迭代修改时,会报ConcurrentModificationException异常,关于这个异常将会在后续文章中讲述。

  但是在并发容器中不会出现这个问题.所以文章只为记录学习过程,不作为任何技术分享.如有错误,请多多谅解.

posted on 2016-06-29 20:07  左侧码工  阅读(209)  评论(0编辑  收藏  举报