String、StringBuilder、 StringBuffer 深入分析 源码解析
java学习有一段时间了,但学习的东西都是框架等东西,java基础知识有点遗忘,所以重温一下java基础知识,写写文章里面有错的希望大家指正共同进步~~
一、String
大家经常会说使用“+”号连接String 字符串比StringBuffer慢,String类对象为不可变对象,一旦你修改了String对象的值,隐性重新创建了一个新的对象,那接下来我们详细分析一下为什么使用“+”号速度会慢,为什么String 对象是不可变对象:
1、final修饰类、引用变量、基本变量
(1)、如果一个类被final修饰则这个类是不能被继承的,没有子类。String类是一个final类,只能说明这个类不能被继承也就没有子类。
(2)、如果一个引用变量被final修饰,则引用变量的值是不能修改,而不是说被引用对象
(3)、 2中说的引用变量的值的问题,如果大家看了深入理解jvm这本书的话可能对这句话有印象:由于reference类型在java虚拟机规范中只规定了一个 指向对象的引用,并没有规定这个引用应该通过何种方式去定位,访问堆中的对象的具体位置,具体实现因不同的虚拟机而不同,有句柄地址和对象地址两种
(4)、句柄方式实现也就是在javaheap(堆内存)中分配了一个句柄池这个句柄池中存放着具体对象的地址,而引用变量中存放的是句柄池中某个句柄的地址,这种方式要查找两次地址所以速度有点慢。
(5)、对象地址方式实现,引用变量中存放的就是javaheap(堆内存)中对象的地址。
(6)、如果final修饰的是基本类型的变量则这个变量的值不能能修改,如果final修饰的是引用变量则这个引用变量的值不能改变也就是4,5 中所说的句柄的地址或对象的地址不能改变而他们所引用的对象的内容是可以改变的。
2、String 类使用"+" 来连接字符的整个过程描述
(1)、大家经常会说不要使用"+" 来连接字符串这样效率不高(相对于 StringBuilder、StringBuffer)那为什么那,看看下面:
String str= "a"; str=str+"b"; str=str+"c";
实现过程:
String str= "a";创建一个String对象,str 引用到这个对象。
在创建一个长度为str.length() 的StringBuffer 对象
StringBuffer strb=new StringBuffer(str);
调用StringBuffer的append()方法将”b“添加进去,strb.append("b");
调用strb 的toString()方法创建String对象,之前对象失去引用而str重新引用到这个新对
象。
同样在创建StringBuffer对象 调用append()方法将”c“添加进去,调用toString() 方法 创建String对象
再将strb引用到 新创建的String对象。之前对象失去引用之后存放在常量池中,等待垃圾回收。
看到上面使用“+”连接字符串的过程,就明白了为什么要使用StringBuffer 来连接字符而不是使用String 的“+”来连接。
(2)、 知道了使用”+“连接的过程,我们再来看看上面提到的使用”+“号为什么会创建新的对象,也就是说String对象是不可变对象。这里有个概念就是对象不 可变,而String 的对象就是一个不可变对象。那什么叫对象不可变那: 当一个对象创建完成之后,不能再修改他的状态,不能改变状态是指不能改变对象内的成员变量,包括基本数据类型的值不能改变。引用类型的变量不能指向其他对 象,引用类型指向的对象的状态也不能改变。对象一旦创建就没办法修改期所有属性,所以要修改不可变对象的值就只能重新创建对象。
3、String 对象不可变 源码分析
(1)、上面说了String 对象为不可变对象,为什么String 对象不可变,String对象的状态不能改变,接下来我们看看String 类的源码:
jdk 1.7 的源码
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
// 数组的被final修饰,所以数据引用变量的值不能变
private final char value[];
/** Cache the hash code for the string */
// 缓存String对象的哈希值
private int hash; // Default to 0
String 类中只有两个成员变量一个是value 一个是hash,这个hash和我们讨论的问题没关系,通过注解我们知道他是缓存String对象的hash值
value
是一个被final修饰的数组对象,所以只能说他不能再引用到其他对象而不能说明他所引用的对象的内容不能改变。但我们在往下看源码就会发现String
类没有给这两个成员变量提供任何的方法所以我们也没办法修改所引用对象的内容,所以String
对象一旦被创建,这个变量被初始化后就不能再修改了,所以说String 对象是不可变对象。
(2)、String 对象不是提供了像replace()等方法可以修改内容的吗,其实这个方法内部创建了一个新String 对象 在把这个新对象重新赋值给了引用变量,看看源码你就相信了他是在内部重现创建了String 对象
public String replace(char oldChar, char newChar) {
if (oldChar != newChar) {
int len = value.length;
int i = -1;
char[] val = value; /* avoid getfield opcode */
while (++i < len) {
if (val[i] == oldChar) {
break;
}
}
if (i < len) {
char buf[] = new char[len];
for (int j = 0; j < i; j++) {
buf[j] = val[j];
}
while (i < len) {
char c = val[i];
buf[i] = (c == oldChar) ? newChar : c;
i++;
}
// 创建新对象
return new String(buf, true);
}
}
return this;
}
总结:
1、String 类是一个final 修饰的类所以这个类是不能继承的,也就没有子类。
2、String 类的成员变量都是final类型的并且没有提供任何方法可以来修改引用变量所引用的对象的内容,所以一旦这个对象被创建并且成员变量初始化后这个对象就不能再改变了,所以说String 对象是一个不可变对象。
3、使用“+”连接字符串的过程产生了很多String 对象和StringBuffer 对象所以效率相比直接使用StringBuffer 对象的append() 方法来连接字符效率低很多。
4、引用变量是存在java虚拟机栈内存中的,它里面存放的不是对象,而是对象的地址或句柄地址。
5、对象是存在java heap(堆内存)中的值
6、引用变量的值改变指的是栈内存中的这个引用变量的值的改变是,对象地址的改变或句柄地址的改变,而对象的改变指的是存放在Java heap(堆内存)中的对象内容的改变和引用变量的地址和句柄没有关系。
二、StringBuffer
我们在上面说String对象是不可变的,而StringBuffer 对象是可变的,大家都说在能大体了解字符串的长度的情况下创建StringBuffer对象时 指定其容量,在上面的string中我们也知道使用“+”号的时候我们也是调用了append方法。
1、 为什么StringBuffer 对象可变, 为什么要尽量指定初始大小,append方法是怎么实现的 下面我们来看看这几个为什么
2、String 对象不可变是因为成员变量都被final修饰并且没有提供任何访问被引用对象的方法所以不能改变,而StringBuffer是怎么样的那我们可以去看看源码:
(1)、public final class StringBuffer extends AbstractStringBuilder
implements java.io.Serializable, CharSequence
{
/** use serialVersionUID from JDK 1.0.2 for interoperability */
static final long serialVersionUID = 3388685877147921107L;
/**
* Constructs a string buffer with no characters in it and an
* initial capacity of 16 characters.
*/
// 默认为16个字符
public StringBuffer() {
super(16);
}
/**
* Constructs a string buffer with no characters in it and
* the specified initial capacity.
*
* @param capacity the initial capacity.
* @exception NegativeArraySizeException if the <code>capacity</code>
* argument is less than <code>0</code>.
*/
public StringBuffer(int capacity) {
super(capacity);
}
/**
* Constructs a string buffer initialized to the contents of the
* specified string. The initial capacity of the string buffer is
* <code>16</code> plus the length of the string argument.
*
* @param str the initial contents of the buffer.
* @exception NullPointerException if <code>str</code> is <code>null</code>
*/
public StringBuffer(String str) {
super(str.length() + 16);
append(str);
}
3、StringBuffer 类继承自AbstractStringBuilder 那在看看AbstractStringBuilder的源码
abstract class AbstractStringBuilder implements Appendable, CharSequence {
/**
* The value is used for character storage.
*/
// 这里我们看到,这个数组没有被final 修饰,所以引用变量的值可以改变,
//可以引用到其他数组对象
char[] value;
/**
* The count is the number of characters used.
*/
// 记录字符的个数
int count;
/**
* This no-arg constructor is necessary for serialization of subclasses.
*/
AbstractStringBuilder() {
}
/**
* Creates an AbstractStringBuilder of the specified capacity.
*/
AbstractStringBuilder(int capacity) {
// 构造函数,创建数组对象
value = new char[capacity];
}
/**
* Returns the length (character count).
*
* @return the length of the sequence of characters currently
* represented by this object
*/
public int length() {
return count;
}
3、如果知道字符串的长度则创建对象的时候尽量指定大小
(1)、在上面的源代码中我们看到StringBuffer 的构造函数默认创建的大小为16个字符。
(2)、如果我们在创建对象的时候指定了大小则创建指定容量大小的数组对象
// 调用父类的构造函数,创建数组对象
public StringBuffer(int capacity) {
super(capacity);
}
/**
* Creates an AbstractStringBuilder of the specified capacity.
*/
AbstractStringBuilder(int capacity) {
//按照指定容量创建字符数组
value = new char[capacity];
}
(3)、如果在创建对象时构造函数的参数为字符串则 创建的数组的长度为字符长度+16字符
这样的长度,然后再将这个字符串添加到字符数组中,添加的时候会判断原来字符数组中的个数加上这个字符串 的长度是否大于这个字符数组的大小如果大于则进行扩容如果没有则添加,源码如下:
public StringBuffer(String str) {super(str.length() + 16);
append(str);
}
append 出现在了这里刚好一起来看看 append方法的实现
4、其实append方法就做两件事,如果 count (字符数组中已有字符的个数)加添加的字符串的长度小于 value.length 也就是小于字符数组的容量则直接将要添加的字符拷贝到数组在修改count就可以了。
5、如果cout和添加的字符串的长度的和大于value.length 则会创建一个新字符数组 再将原有的字符拷贝到新字符数组,再将要添加的字符添加到字符数组中,再改变conut(字符数组中字符的个数)
整个添加过程的源码如下:
public synchronized StringBuffer append(Object obj) {
super.append(String.valueOf(obj));
return this;
}
public AbstractStringBuilder append(Object obj) {
return append(String.valueOf(obj));
}
这个方法中调用了ensureCapacityInternal ()方法判断count(字符数组原有的字符个数)+str.length() 的长度是否大于value容量
/**
* This method has the same contract as ensureCapacity, but is
* never synchronized.
*/
private void ensureCapacityInternal(int minimumCapacity) {
// overflow-conscious code
if (minimumCapacity - value.length > 0)
expandCapacity(minimumCapacity);
}
如果count+str.length() 长度大于value的容量 则调用方法进行扩容
/**
* This implements the expansion semantics of ensureCapacity with no
* size check or synchronization.
*/
void expandCapacity(int minimumCapacity) {
int newCapacity = value.length * 2 + 2;
if (newCapacity - minimumCapacity < 0)
newCapacity = minimumCapacity;
if (newCapacity < 0) {
if (minimumCapacity < 0) // overflow
throw new OutOfMemoryError();
newCapacity = Integer.MAX_VALUE;
}
value = Arrays.copyOf(value, newCapacity);
}
Arrays.copyOf(value,newCapacity) 复制指定的数组,截取或用 null 字符填充(如有必要),以使副本具有指定的长度。
上面的getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin)
将字符从此字符串复制到目标字符数组dst中,第一个参数 第二个参数截取要添加字符串的长度,第三个为目标字符数组第四个为字符串要添加到数组的开始位置
到这里数组的赋值都结束了,修改count的值,整个append也就结束了。
总结:
1、StringBuffer 类被final 修饰所以不能继承没有子类
2、StringBuffer 对象是可变对象,因为父类的 value [] char 没有被final修饰所以可以进行引用的改变,而且还提供了方法可以修改被引用对象的内容即修改了数组内容。
3、在使用StringBuffer对象的时候尽量指定大小这样会减少扩容的次数,也就是会减少创建字符数组对象的次数和数据复制的次数,当然效率也会提升。
StringBuilder 和StringBuffer 很像只是不是线程安全的其他的很像所以不罗嗦了。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)