String的不可变性

1.什么是不可变?

String不可变很简单,如下图,给一个已有字符串“abcd”第二次赋值成"abced",不是在原内存地址上修改数据,而是重新指向一个新对象,新地址。


2.String为什么不可变?

翻开JDK源码,java.lang.String类起手前三行,是这样写的:

[java]  view plain  copy
  1. public final class String  
  2.     implements java.io.Serializable, Comparable<String>, CharSequence  
  3. {  
  4.     /** String本质是个char数组. 而且用final关键字修饰.*/  
  5.     private final char value[];  
首先String类是用final关键字修饰,这说明String不可继承。再看下面,String类的主力成员字段value是个char[]数组,而且是用final修饰的。final修饰的字段创建以后就不可改变。


有的人以为故事就这样完了,其实没有。因为虽然value是不可变的,也只是value这个引用地址不可变。挡不住Array数组是可变的事实

也就是说Array变量只是stack上的一个引用,数据的本体结构在heap堆。String类里的value用final修饰,只是说stack里的这个叫value的引用地址不可变。没有说堆里array本身数据不可变。看这个这个例子,

[java]  view plain  copy
  1. final int[] value={1,2,3}  
  2. int[] another={4,5,6};  
  3. value = another;//编译器报错,final不可变  

value用final修饰,编译器不允许我把value指向堆区另一个地址。但如果直接对数组元素动手,分分钟搞定。

[html]  view plain  copy
  1. final int[] value={1,2,3};  
  2. value[2]=100;//这时候数组里已经是{1,2,100}  
所以String是不可变,关键是因为SUN公司的工程师,在后面所有String的方法里很小心地没有去动Array里的元素,没有暴露内部成员字段。private final char value[]这一句里,private的私有访问权限的作用都比final大。而且设计师还很小心地反整个String设计成final禁止继承,避免被其他人继承后破坏。所以String是不可变的关键在于底层的实现,而不是一个final。考验的是工程师构造数据类型,封装数据的功力。


3.不可变有什么好处?

这个最简单的原因,就是为了安全。看下面这个场景,一个函数appendStr()在不可变的String参数后面加上一段“bbb”后返回。appendSb()负责在可变的StringBuilder后面加"bbb"。

[java]  view plain  copy
  1. Class Test{  
  2.     //不可变的String  
  3.     public static String appendStr(String s){  
  4.         s+="bbb";  
  5.         return s;  
  6.     }  
  7.       
  8.     //可变的StringBuilder  
  9.     public static StringBuilder appendSb(StringBuilder sb){  
  10.         return sb.append("bbb");  
  11.     }  
  12.       
  13.     public static void main(String[] args){  
  14.          String s = new String("aaa");  
  15.          String ns = Test.appendStr(s);  
  16.          System.out.println("String aaa>>>"+s.toString());  
  17.            
  18.          //StringBuilder做参数  
  19.          StringBuilder sb = new StringBuilder("aaa");  
  20.          StringBuilder nsb = Test.appendSb(sb);  
  21.          System.out.println("StringBuilder aaa >>>"+sb.toString());  
  22.     }  
  23. }  

如果程序员不小心像上面例子里,直接在传进来的参数上加上“bbb”.因为Java对象参数传的是引用,所有可变的StringBuffer参数就被改变了。可以看到变量sb在Test.appendSb(sb)操作之后,就变成了"aaabbb"。有的时候这可能不是程序员的本意。所以String不可变的安全性就体现在这里。


再看下面这个HashSet用StrinbBuilder做元素的场景,问题就更严重了,而且更为隐蔽。

[java]  view plain  copy
  1. HashSet<StringBuilder> hs = new HashSet<StringBuilder>();  
  2.         StringBuilder sb1 = new StringBuilder("aaa");  
  3.         StringBuilder sb2 = new StringBuilder("aaabbb");  
  4.         hs.add(sb1);  
  5.         hs.add(sb2);    //这时候HashSet里是{"aaa","aaabbb"}  
  6.           
  7.         StringBuilder sb3 = sb1;  
  8.         sb3.append("bbb");//这时候HashSet里是{"aaabbb","aaabbb"}  
  9.         System.out.println(hs);  

StringBuilder型变量sb1和sb2分别指向了堆内的字面量“aaa”和"aaabbb"。把它们都插入一个HashSet。到这一步没问题。但如果后面我把变量sb3也指向sb1的地址,再改变sb3的值,因为StringBuilder没有不可变性的保护,sb3直接在原先“aaa”的地址上改。导致sb1的值也变了。这时候,HashsSet上就出现了两个相等的键值"aaabbb"。破坏了HashSet键值的唯一性。所以千万不要用可变类型做HashMap和HashSet键值。


还有一个大家都知道,就是在并发场景下,多个线程同时读一个资源,是不会引发竞态条件的。只有对资源做写操作才有危险。不可变对象不能被写,所以线程安全。


最后别忘了String另外一个字符串常量池的属性。像下面这样的字符串one和two都用字面量"something"赋值。它们其实都指向同一个内存地址。

String one  = "someString";

String two = "someString";




这样在大量使用字符串的情况下,可以节省内存空间,提高效率。但之所以能实现这个特性,String的不可变是最基本的必要条件。要是内存里字符串内容能改来改去,这么做就完全没有意义了。


posted @ 2018-04-17 22:39  車輪の唄  阅读(22)  评论(0编辑  收藏  举报  来源