并发编程初探-对象的共享
对象的共享
一、可见性
在没有同步的情况下,编译器以及运行时等收可能对操作的执行顺序进行一些意想不到的调整,在缺乏足够同步的多线程程序中,要想对内存操作的执行顺序进行判断,几乎无法得到正确的结论。
1.缺乏同步的程序中可能出产生错误结果的一种情况:失效数据
2.非原子操作
当线程在没有同的情况下读取变量时,可能会得到一个失效值,但至少这个值是由某个线程设置的值,而不是一个随机值。这种安全性保证也被称为最低安全性。
最低安全性适用于绝大多数变量,但是存在一个例外:非volatile类中的64位数值变量。
Java内存模型要求,变量的读取操作和写入操作都必须是原子操作,但对非volatile类型的long和double变量,JVM允许将64位的读操作或写操作分解为两个32位操作。
当读取一个非volatile类型的long变量时,如果对该变量的读操作和写操作在不同的线程中执行,俺么很可能会读到某个值得高32位和另一个值得低32位。因此,即使不考虑失效数据问题,在多线程程序中使用共享可变的long和double等类型的变量也是不安全的。除非用关键字volatile来声明他们,或者用锁来保护起来。
3.加锁与可见性
加锁的含义不仅仅局限于互斥行为,还包括内存可见性,为了确保所有线程都能看到共享变量的最新值,所有执行读操作或者写操作的线程必须在同一个锁上同步。
4.volatile变量
volatile变量,用来确保将变量的更新操作通知到其他线程。当变量声明为volatile类型后,编译器与运行时都会注意到这个变量是共享德的,因此不会将该变量上的操作与其他内存操作仪器重排序。
volatile变量不会被缓存在寄存器或者其他处理器不可见的地方,因此在读取volatile类型的变量时总会返回最新写入的值。
在访问volatile变量时会执行加锁操作,因此,也就不会执行线程阻塞,因此volatile变量时一种比synchronized关键字更轻量级的同步机制。
仅当volatile变量能简化代码的实现以及对同步策略的验证时,才应该使用它们。如果在验证正确性时需要对可见性进行复杂的判断,那么久不要使用volatile变量。volatile变量的正确性使用方式包括:确保它们自身状态的可见性,确保它们所引用对象的状态的可见性,以及标识一些更重要的程序生命周期事件的发生(例如,初始化或关闭)。
volatile变量的一种典型用法:检查某个标记状态以判断是否退出循环。
加锁机制既可以确保可见性,又可以确保原子性,而volatile变量只能确保可见性。
当且仅当满足一下所有条件时,才因该使用volatile变量:
a)对变量的写入操作不依赖变量的当前值,或者你能确保只有单个线程更新变量的值。
b)该变量不会与其他装调变量一起纳入不变性条件中
c)在访问变量时不需要加锁
二、发布与逸出
发布(Publish)一个对象的意思是指,是对象能够在当前作用域之外的代码中使用。
当某个不应该发布的对象被发布时,这种情况就被成为逸出(Escape)。
发布对象的最简单的方法是将对象的引用保存到一个公有的静态变量中,以便任何类和线程都能看见该对象。
1.安全对象的构造过程
不要在构造过程中使this引用逸出。
当对象在其构造函数中创建一个线程时,无论是显式创建(通过将它传给构造函数)还是隐式创建(由Thread或Runnable是该对象的一个内部类),this引用都会被新创建的线程共享。在对象尚未完全构建之前,先的线程就可以看见它。在构造函数中创建线程并没有错,但是最好不要立即启动它,而是通过一个start或initialize方法来启动。在构造函数中调用一个不可改写的实例方法时,同样会导致this引用在构造过程中逸出。
三、线程封闭
当访问共享的可变数据时,通常需要使用同步。一种避免使用同步的方式就是不共享数据。如果仅在单线程内访问数据,就不需要同步,这种技术称为线程封闭(Thread Confinement) ,它是实现线程安全性的最简单方式之一。当某一个对象封闭在一个线程中时,这种用法将自动实现线程安全性,即使被封闭的对象本身不是线程安全的。
在Swing中大量使用了线程封闭技术。
线程封闭技术另一种常见应用使JDBC的connection对象,JDBC规范并要求connection对象必须是线程安全的。在典型的服务器应用程序中,线程从连接池中获取一个connection对象,并且用该对象来处理请求,使用完成后再将对象返回给连接池。由于大多数请求都是由的单个线程采用同步的方式来处理,并且在connection对象返回之前,连接池不会再将它分配给其他线程,因此,这种连接管理模式在处理请求时隐含地将connection对象封闭在线程中。
在Java语言中并没有强制规定某个变量必须锁来保护,同样在Java语言中也没有强制将一个对象封闭在 某个线程中。线程封闭式在程序设计中的一个考虑因素,必须在程序中实现,Java语言及核心库提供了一些机制来帮助维持线程封闭性,例如局部变量和ThreadLocal类,但即便如此,程序员仍然需要负责确保在线程中的对象不会从线程中逸出。
1.Ad_hoc线程封闭
Ad_hoc线程封闭是指,维护线程封闭性的职责完全由程序实现类承担,Ad_hoc线程封闭式非常脆弱的,因为没有任何一种语言特性,例如可见性修饰符或局部变量,能将对象封闭到目标线程上。
当决定使用线程封闭技术时,通常是因为要将某个特定的子系统实现为一个单线程子系统。在某种情况下,单线程子系统提供的简便性要胜过Ad_hoc线程封闭技术的脆弱性。使用单线程子系统的另一个原因是为了避免死锁。
2.栈封闭
栈封闭是线程封闭的一种特例,在栈封闭中,只能通过局部变量才能访问对象局部变量的固有属性就是封闭在程序的执行线程之中。
如果在线程内部上下文中使用非线程安全的对象,那么该对象仍然是线程安全的。
3.ThreadLocal类
维持线程封闭的一种更规范的方法是ThrashLocal,这个类能使线程中的某个值域保存值得对象关联起来。ThreadLocal提供了get和set等访问接口或方法,这些方法为每个使用该变量的线程都存有一份独立的副本,因此get总是返回由当前执行线程在调用set时设置的最新值。
ThreadLocal对象通常用于防止对可能的单实例变量或全局变量进行共享。
当某个频繁执行的操作需要一个临时变量的操作需要一个临时变量,例如一个缓冲区,而同时又希望避免在每次执行时都更新分配该对象,就可以使用这项技术。
ThreadLocal变量类似于全局变量,它能降低代码可重用性,并在类之间引入隐含的耦合性,因此在使用时要格外小心。
4.不变性
满足同步的另一种方法是使用不可变对象(Immutable Object)。
如果某个对象被创建后其状态不能被修改,那么这个对象就被称为不可变对象。线程安全性是不可变对象的固有属性之一,它们的不变性条件是由构造函数创建的,只要它们不改变,那么这些不变性条件就能得以维持。
当满足以下条件时,对象才是不可变的:
1)对象创建以后其状态就不能修改
2)对象的所有域都是final类型
3)对象是正确创建的(在对象的创建期间,this引用没有逸出)
final域:关键字final可以视为C++中const机制的一种受限版本,用于构造不可变对象。final类型的域是不能修改的(但是如果final域引用的对象是可变的,那么这些被引用的对象是可以修改的)。final域能确保初始化过程的安全性,从而可以不受限制地访问不可变对象,并在共享这些对象时无需同步。除非需要更高的可见性,否则应将所有的域都声明为私有域。除非需要某个域是可变的,否则应将其声明为final域。
对于在访问和更新多个相关变量时出现的竞争问题,可以通过将这些变量全部保存在一个不可变对象中来消除,如果是一个可变的对象,那么当线程获得了该对象的引用后,就不必担心另一个线程会修改对象的状态。如果要更新这些变量,那么可以创建一个新的容器,但其他使用原有对象的线程,仍然会看到对象处于一致的状态。
5.安全发布
不正确的发布:正确的对象被破坏。不能指望一个尚未被完全创建的对象拥有完整性。
不可变对象与初始化安全性:任何线程都可以在需要额外的同步的情况下安全地访问不可变对象,即使在发布这些对象是没有使用任何同步。
1.安全发布的常用模式:
1)要安全发布一个对象,对象的引用以及对象的状态必须同时对其他线程可见。一个正确的构造的对象可以通过一下的方式来安全地发布:
a)在静态初始化函数中初始化一个对象引用
b)将对象的引用保存到volatile类型的域或者AtomitReference对象中
c)将对象的引用保存到某个正确构造对象的final类型域中
d)将对象的引用保存到一个由锁保护的域中
2)线程安全库中的容器提供了一下的安全发布保证:
a)通过将一个键或者值放入Hashtable,SynchronizedMap或者ConscurrentMap中可以安全的将它发布给任何从这些容器中访问的线程(无论是直接访问还是通过迭代器访问)。
b)通过将某个元素放入Vector,CopyOnWriteArrayList,CopyOnWriteArraySet,SynchronizedList或SynchronizedSet中,可以将该元素安全的发布到任何从这些容器中访问该元素的线程。
c)通过将某个元素放入BlockingQueue或者ConcurrentLinkedQueue中,可以将该元素安全地发布到从这些队列中访问该元素的线程。
3)通常要发布一个静态构造的对象,最简单和安全的方式是使用静态的初始化器。静态初始化器由JVM在类的初始化阶段执行。由于在JVM内部存在着同步机制,因此通过这种方式初始化的任何对象都可以被安全地发布。
2.事实不可变对象
如果一个对象从技术上来看是可变的,但其状态在发布后不会再改变,那么这种对象称为“事实不可变对象”。在没有额外的同步的情况下,任何线程收可以安全地使用被安全发布的事实不可变对象。
3.可变对象
对象的发布需求取决于它的可变性:
1)不可变对象可以通过任意机制来发布
2)事实不可变对象必须通过安全发布方式来发布
3)可变对象必须通过安全方式来发布,并且必须是线程安全的或者由某个锁保护起来
4.安全共享对象
在并发程序中使用和共享对象是可以使用一些实用的策略,包括:
1)线程封闭:线程封闭的对象只能由一个线程拥有,对象被封闭在该线程中,并且只能由这个线程修改
2)只读共享:在没有额外天同步的情况下,共享的只读对象可以由多个线程并发访问,但任何线程都不能修改它。共享的只读对象包括不可变对象和事实不可变对象
3)线程安全共享:线程安全的对象在其内部实现同步,因此多个线程可以通过对象的公有接口来访问为不需要进一步的同步
4)保护对象:被保护的对象只能通过持有特定的锁来访问。保护对象包括封装在其他线程安全对象中的对象,以及发布的并且由某个特定锁保护的对象。