解析Java中的String、StringBuilder、StringBuffer类（一）

引言

String 类及其相关的StringBuilder、StringBuffer 类在 Java 中的使用相当的多，在各个公司的面试中也是必不可少的。因此，在本周，我打算花费一些时间来认真的研读一下 String、StringBuilder、StringBuffer类的相关代码。

String的不可变性

这个特性是 String 相当重要的一个特性，为了深入理解，我直接贴上其源代码

public String concat(String str) {
        int otherLen = str.length();
        if (otherLen == 0) {
            return this;
        }
        int len = value.length;
        char buf[] = Arrays.copyOf(value, len + otherLen);
        str.getChars(buf, len);
        return new String(buf, true);
    }
public String replace(char oldChar, char newChar) {
        if (oldChar != newChar) {
            int len = value.length;
            int i = -1;
            char[] val = value; /* avoid getfield opcode */

            while (++i < len) {
                if (val[i] == oldChar) {
                    break;
                }
            }
            if (i < len) {
                char buf[] = new char[len];
                for (int j = 0; j < i; j++) {
                    buf[j] = val[j];
                }
                while (i < len) {
                    char c = val[i];
                    buf[i] = (c == oldChar) ? newChar : c;
                    i++;
                }
                return new String(buf, true);
            }
        }
        return this;
    }
public String substring(int beginIndex, int endIndex) {
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        if (endIndex > value.length) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        int subLen = endIndex - beginIndex;
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        return ((beginIndex == 0) && (endIndex == value.length)) ? this
                : new String(value, beginIndex, subLen);
    }
    .....

通过以上几个方法的代码，我们可以得出以下的结论：

String 对象时不可变的。所谓不可变的意思是说我们使用的很多方法来对字符串进行修改,如以下所示：

public static void main(String[] args) {
        String str = "test";
        str = str + "a";
        System.out.println(str);//testa
        str += "b";
        System.out.println(str);//testab
    }

诸如上面的 + 号和 concat, replace 等看起来会改变 String 值的方法，其最终都是创建了一个全新的 String 对象，用来包含修改后的字符串内容。str 最先指向的对象 "test" 一直呆在原物理位置上。各个方法操作的其实是复制的一份引用，返回的是一个新的对象，以上例子的原 "test" 还在原始处。

一些误区：String 的不可变性并不是因为下面的语句

 private final char value[];

final 在引用类型中，只是确保了不能指向其它引用，而不能确保引用的更改。value 是 private 的，虽然 String 没有提供更改value的方法，但通过反射可将其更改。

String的 + 与 += 符号

众所周知， C++ 是可以重载操作符的，但 Java 并不允许程序员对操作符进行重载，而String的 + 与 += 符号却违反了这个规则。我们都知道，Java 中的这两个操作符都是对字符串进行拼接，看一下以下的代码：

class Test{
	public static void main(String[] args){
		String str = "a";
		str +="hello" + "world" + "!";
		System.out.println(str);//ahelloworld!
		
		String pStr = "a" + str + "b";
		System.out.println(pStr);//aahelloworld!b
	}
}

如符按照我们理解的 String 的不可变性，那么在多次进行 + 操作时，应该会在最终的结果之前生成多个中间的文件，那么事实真的是这样子吗？如果是这样子想一下就知道效率和性能有多糟糕了。我们对代码进行反编译。

javap -c Test

其产生了如下的 JVM 字节码：

我们可以看到，在以上的代码中，编译器为我们自动的引入了 java.lang.StringBuilder 类，并使用了该类的 append(String str) 这个方法，最终使用 toString() 产生 String 字符串并进行了赋值。

「循环」中拼接字符串不要使用 String

那么，我们是不是可以愉快的使用 + 和 += 这两个操作符了呢？ NO! 编译器所能做的也是有限的。

public class Test {
    public static void main(String[] args) {
        String s = "";
        long start = System.currentTimeMillis();
        for (int i = 0; i <100000 ; i++) {
            s += "a";
        }
        long end = System.currentTimeMillis();
        System.out.println("String time:"+ (end - start));

        StringBuilder sb = new StringBuilder("");
        long start2 = System.currentTimeMillis();
        for (int i = 0; i <100000 ; i++) {
           sb.append("a");
        }
        long end2 = System.currentTimeMillis();
        System.out.println("StringBuilder time:"+ (end2 - start2));
    }
}

在以上的代码中，输出是这样子的, 我还去掉了中间装载类所花费的时间：

String time:2573
StringBuilder time:5

为什么差距这么大呢？

同样的，我们对这个文件进行反编译，第一个循环的字节码如下：
第一个循环字节码
可以看出 10 到 40 就是我们的循环体了，在该循环体中，有一个 new 的操作，这意味着每次进行循环时，都会创建一个 StringBuilder 的对象，每次都使用一次 toString() 方法。而这些过程都是相当的影响性能的。

而第二个循环的字节码如下：
这里写图片描述
从以上我们可以看出，循环是从 95 到 113 行，而这个过程中，始终只有一个 StringBuilder 的对象，也就是说它没有产生新的对象，可想而知两个之间的性能是怎么产生差异的了。

因此，「循环」中拼接字符串不要使用 String，这个在写 toString() 方法时可能会遇到。

好，今天我们就分析到这里，下篇文章再会。

另，转载请注明出处。

posted @ 2018-03-07 23:43 阿进的写字台阅读(654) 评论(2) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义

公告

昵称：阿进的写字台
园龄： 7年8个月
粉丝： 98
关注： 4

+加关注

2025年3月

日

一

二

三

四

五

六

阿进的写字台

解析Java中的String、StringBuilder、StringBuffer类（一）

引言

String的不可变性

String的 + 与 += 符号

「循环」中拼接字符串不要使用 String

公告

搜索

常用链接

我的标签

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论