关于String及StringBuilder的几点区别

直接看示例1：

public class StringTest{
	
	void stringReplace(String strTemp){
		strTemp=strTemp.replace('l','i');
	}

	void stringBufferAppend(StringBuffer sbTemp){
		sbTemp=sbTemp.append('c');
	}

	public static void main(String[] args){
		StringTest st=new StringTest();
		String str=new String("hello");
		StringBuffer sb=new StringBuffer("hello");

		// String str1=new String("hello");
		// StringBuffer sb1=new StringBuffer("hello");

		// System.out.println("str.equals(sb)= "+str.equals(sb));
		// System.out.println("str.equals(str1	)= "+str.equals(str1));
		// System.out.println("sb.equals(str)= "+sb.equals(str));
		// System.out.println("sb.equals(sb1)= "+sb.equals(sb1));

		st.stringReplace(str);
		st.stringBufferAppend(sb);
		System.out.println("str= "+str+"\tsb= "+sb);
	}
}

输出结果：

str= hello	sb= helloc

上面的示例无非就是方法传值与传址的问题，因为形参为引用类型，因此实参传递过来的是对象的地址值，问题来了：改变该地址所对应的内容，实参应该也会跟着发生变化，如sb最终结果那样，但str却没有，为何？

这就是String与StringBuilder的区别：

字符串的可变与不可变

JDK_1.8中这样解释：

Strings are constant; their values cannot be changed after they are created. 
String buffers support mutable strings. Because String objects are immutable 
they can be shared.

String创建的字符串是不可变的，而StringBuilder(或StringBuffer)通过字符缓冲区创建字符串，可变；

先来解析下String的不可变：

String s="hello";
s="world";

对象s在创建的时候先查看常量池中是否有"hello"，有则指向它，没有就创建一个"hello"，再指向它，但当重新对s赋值为"world"时，常量池中的"hello"并没有改变，java会重新开辟一个内存存储新值"world"，并令s指向"world"；

因此在示例1中，当调用stringReplace()方法时，实参str所存储的地址值传给了形参strTemp后，strTemp指向了常量池中"hello"，当对其进行字符替换时，java会重新创建"heiio"，并让形参strTemp指向它，因此形参和实参指向了不同的区域，结果自然显而易见；

另外，String的不可变是由于：

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    private final char value[];//final的作用，使之初始化后不可改变
    ……
}

(P.S.虽然value是用final来修饰的，但仍有办法可以直接改变其值，具体可以参见反射 )

再来对比下StringBuilder的可变：

StringBuilder sb=new StringBuilder("hello");
sb.append("world");

在创建StringBuilder对象时，java实际上在堆中创建了字符类型数组char[]，存储完"hello"后通过append方法在增加"world"，并未开辟新的内存区，形参和实参指向同一区域，因此形参对对象内容进行变化，实参也会跟着变化；

来看下StringBuilder构造器的底层代码：

public StringBuilder() {
        super(16);
    }

public StringBuilder(int capacity) {
        super(capacity);
    }

public StringBuilder(String str) {
        super(str.length() + 16);
        append(str);
}

public StringBuilder(CharSequence seq) {
        this(seq.length() + 16);
        append(seq);
}

其基类AbstractStringBuilder的构造方法：

char[] value;
AbstractStringBuilder(int capacity) {
        value = new char[capacity];
}

……

可以发现StringBuilder实际创建了一个默认16字符长的char型数组(亦可指定长度)：char[] value；

若为对象赋值时，所存储的字符串长度未超过所定义的char数组长度，则按顺序存储相应字符，若超过所定义的数组长度，则自动扩充其长度，因此说StringBuffer是可变的；

我们还是继续看append()底层代码比较形象：

public AbstractStringBuilder append(String str) {
        if (str == null)
            return appendNull();
        int len = str.length();
        ensureCapacityInternal(count + len);
        str.getChars(0, len, value, count);
        count += len;
        return this;
}

private void ensureCapacityInternal(int minimumCapacity) {
        if (minimumCapacity - value.length > 0)
            expandCapacity(minimumCapacity);
}

void expandCapacity(int minimumCapacity) {
        int newCapacity = value.length * 2 + 2;
        if (newCapacity - minimumCapacity < 0)
            newCapacity = minimumCapacity;
        if (newCapacity < 0) {
            if (minimumCapacity < 0) // overflow
                throw new OutOfMemoryError();
            newCapacity = Integer.MAX_VALUE;
        }
        value = Arrays.copyOf(value, newCapacity);
}

当为StringBuilder对象增加内容时，会先计算所需最小空间：minimumCapacity=count+len;并与原数组长度的2倍+2即newCapacity进行比较，取较大值并为数组value重新赋值，赋值采用的是数组复制的方式进行；

常见的数组复制有两种方法：一为：Arrays.copyOf()，另一为：System.arraycopy()，差别在于后者可能存在下标越界的问题，其实前者也是通过调用后者的方法来实现的：

public static char[] copyOf(char[] original, int newLength) {
        char[] copy = new char[newLength];
        System.arraycopy(original, 0, copy, 0,
                         Math.min(original.length, newLength));
        return copy;
}

由于重新为临时数组copy定义了长度newLength，因此复制的时候不会出现越界问题；在数组复制结束后，将临时数组copy赋值给value，使之指向新的区域，完成append()操作 (这里注意：引用变量value的指向发生了变化，但StirngBuilder的指向没有变，只不过其成员变量(恰巧是个引用变量value)的值发生了改变，因此形参sbTemp和sb仍指向同一区域)；

equals方法

示例1中注释掉的几个equals()语句，结果只有String与String比较时才返回true，这是String与StringBuilder的另一个区别；

我们要直到equals()方法的返回结果取决于你如何重写的，如直接继承Object的方法，则比较的是变量的值，对于StringBuilder，它并未重写该方法，因此对两个引用变量进行比较自然返回false；而String类重写了该方法，具体如下：

public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;
    }

可知，若两个引用变量指向同一区域，则自然返回true，若非，则判断anObject是否是String的实例，若是则进行值比较，否则直接返回false；

效率的差别

public class StringBuilderTest2{
	public static void main(String[] args){
            
            StringBuilder sb=new StringBuilder();
            StringBuilder sb1=new StringBuilder(Integer.MAX_VALUE/7);
            String s=null;
            System.out.println(Integer.MAX_VALUE+"\n"+sb1.capacity());
            long start=System.currentTimeMillis(),end;
            for(int i=0;i<1000000;i++){
                sb.append(1);
            }
            end=System.currentTimeMillis();
            System.out.println("默认初始化SB时循环100w次耗时："+(end-start));
            for(int i=0;i<1000000;i++){
                sb1.append(1);
            }
            start=System.currentTimeMillis();
            System.out.println("给定值初始化SB1时循环100w次耗时："+(start-end));
            
            for(int i=0;i<100000;i++){
                s+=1;
            }
            end=System.currentTimeMillis();
            System.out.println("String“+”运算10W次耗时："+(end-start));
        }
}

输出：

2147483647
306783378//初始化值
默认初始化SB时循环100w次耗时：35
给定值初始化SB1时循环100w次耗时：16
String“+”运算10W次耗时：3211

可以发现在循环“+”/append()运算时，String类的效率明显低于StringBuilder，为何？

这里继续使用javap来分析：

String s=null;
s+=1;

0: aconst_null   
1: astore_1      
2: new           #2                  // class java/lang/StringBuilder
5: dup           
6: invokespecial #3                  // Method java/lang/StringBuilder."<init>":()V
9: aload_1       
10: invokevirtual #4                  // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
13: iconst_1      
14: invokevirtual #5                  // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder;
17: invokevirtual #6                  // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
20: astore_1      
21: return

可以看到编译器在解析String"+"运算时，会转换成StringBuilder，调用append()方法，再通过toString()赋值，因此循环运算时，就不断发生创建对象和产生垃圾，这过程消耗了资源，造成了效率的下降；

另外，我们也可以发现调用StringBuilder构造方法时若给它传入较大整数作为参数，则运算效率也会有明显的提升，这跟前面所提扩容时数组复制有关，给定较大初始缓存区，自然不需要频繁扩容；
当然，这里顺带提一下，如果直接把String的"+"运算写成形如：s=""+1+1+1……，而不是通过循环来不断调用变量，则编译器会直接求出其字面量，运行时不会再转换为StringBuilder，效率当然就比后者高了；

posted @ 2014-05-05 23:59 冰川孤辰阅读(115) 评论(0) 编辑收藏举报

刷新页面返回顶部

冰川孤辰

关于String及StringBuilder的几点区别

字符串的可变与不可变

equals方法

效率的差别

公告