String的源码理解(未写完)
String本质上是一个char数组(jdk 9之后是byte数组),并且是一个声明为final的数组,并且String的不可变也是通过这种把数组声明为final来实现的
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
}
这个数组被声明为final之后,就意味着数组初始化之后值不可再变化,并且也不能再引用其他的数组,因此用这种方式可以保证String的唯一,那么为什么String要声明为不可变呢?好处主要有两个,安全和高效,从安全的角度上看,因为String是不可变的,因此可以一保证一个String的唯一性。
提到高效的话,我们就需要引入String常量池这个概念,字符串常量池位于堆内存中,专门用来存储字符串常量,可以提高内存的使用率,避免开辟多块空间存储相同的字符串,在创建字符串时 JVM 会首先检查字符串常量池,如果该字符串已经存在池中,则返回它的引用,如果不存在,则实例化一个字符串放到池中,并返回其引用。
确切的说,在jdk1.7之前,用于存储字符串文字的区域位于运行时常量池中。VM规范说虽然方法区域 在逻辑上是堆的一部分,但并不表示在方法区中分配的内存会受到垃圾回收或其他与分配给堆的正常数据结构相关的行为的影响,在Java 7之前,该池位于热点JVM上的堆的permgen空间中,但自Java 7以来它已被移至堆的主要部分。通俗的说,常量池java 7之后在内存中的存储位置就是位于堆中
当一个声明一个String对象或者new 一个String对象时,首先会从常量池中进行查找是否有这个和这个字符串的值相等的字符串,如果有直接返回常量池中该字符串的引用,如果没有,在常量池中创建这个字符串常量,放入常量池。因此对于高效而言,当创建一个字符串的时候,从常量池中寻找是否有对应的字符串,如果有就返回引用,免去了频繁创建的性能开销。
new String 和声明String之间的区别
public class Main {
public static void main(String[] args) {
String a = "a";
String b = "a";
String c = new String("a");
String d = new String("a");
System.out.println(a == b);//true
System.out.println(c == d);//false
}
}
- String a = "a" ,String b = "a"会在首先在常量池中寻找是否有字符串"a",有则返回引用,没有则创建,因此这两个比较是true,因为是相同的引用,因此 String a 这种方式只会创建一个对象,或者不创建对象
- new String这种方式至少创建一个对象或者创建两个对象,首先 String c = new String("a");这句话,至少会在堆中创建一个为c的String对象,他的值为a,如果这个值在常量池中没有的话,那么还会创建一个值为a的常量对象放入常量池,所以说它至少创建一个,可能创建两个,
以下是 String 构造函数的源码,可以看到,在将一个字符串对象作为另一个字符串对象的构造函数参数时,并不会完全复制 value 数组内容,而是都会指向同一个 value 数组。
public String(String original) {
this.value = original.value;
this.hash = original.hash;
}
1