String/ StringBuilder/ StringBuffer
1. 首先String不属于8种基本数据类型,String是一个对象。
因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性。
2. new String()和new String(“”)都是申明一个新的空字符串,是空串不是null;
3. String str=”kvill”;String str=new String (“kvill”); 的区别:
在这里,我们不谈堆,也不谈栈,只先简单引入“常量池”这个简单的概念。
常量池(constant pool)指的是在编译期被确定,并被保存在已编译的.class文件中的一些数据。它包括了关于类、方法、接口等中的常量,也包括字符串常量。
看例1:
1 String s0=”kvill”; 2 String s1=”kvill”; 3 String s2=”kv” + “ill”; 4 System.out.println( s0 == s1 ); 5 System.out.println( s0 == s2 );
结果为:
true true
解读:首先,我们要知道Java会确保一个字符串常量只有一个拷贝。
因为例子中的s0和s1中的”kvill”都是字符串常量,它们在编译期就被确定了,所以s0==s1为true;而”kv”和”ill”也都是字符 串常量,当一个字符串由多个字符串常量连接而成时,它自己肯定也是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中 ”kvill”的一个引用。
所以我们得出s0==s1==s2;
用new String() 创建的字符串不是常量,不能在编译期就确定,所以new String() 创建的字符串不放入常量池中,它们有自己的地址空间。
看例2:
1 String s0=”kvill”; 2 String s1=new String(”kvill”); 3 String s2=”kv” + new String(“ill”); 4 System.out.println( s0==s1 ); 5 System.out.println( s0==s2 ); 6 System.out.println( s1==s2 );
结果为:
false false false
例2中s0还是常量池中”kvill”的应用,s1因为无法在编译期确定,所以是运行时创建的新对象”kvill”的引用,s2因为有后半部分new String(“ill”)所以也无法在编译期确定,所以也是一个新创建对象”kvill”的应用;明白了这些也就知道为何得出此结果了。
4. String.intern():
再补充介绍一点:存在于.class文件中的常量池,在运行期被JVM装载,并且可以扩充。String的intern()方法就是扩充常量池的一个 方法;当一个String实例str调用intern()方法时,Java查找常量池中是否有相同Unicode的字符串常量,如果有,则返回其的引用, 如果没有,则在常量池中增加一个Unicode等于str的字符串并返回它的引用;看例3就清楚了
例3:
1 String s0= “kvill”; 2 String s1=new String(”kvill”); 3 String s2=new String(“kvill”); 4 System.out.println( s0==s1 ); 5 System.out.println( “**********” ); 6 s1.intern(); 7 s2=s2.intern(); //把常量池中“kvill”的引用赋给s2 8 System.out.println( s0==s1); 9 System.out.println( s0==s1.intern() ); 10 System.out.println( s0==s2 );
结果为:
false ********** false //虽然执行了s1.intern(),但它的返回值没有赋给s1 true //说明s1.intern()返回的是常量池中”kvill”的引用 true
最后我再破除一个错误的理解:
有人说,“使用String.intern()方法则可以将一个String类的保存到一个全局String表中,如果具有相同值的Unicode字 符串已经在这个表中,那么该方法返回表中已有字符串的地址,如果在表中没有相同值的字符串,则将自己的地址注册到表中“如果我把他说的这个全局的 String表理解为常量池的话,他的最后一句话,“如果在表中没有相同值的字符串,则将自己的地址注册到表中”是错的:
看例4:
1 String s1=new String("kvill"); 2 String s2=s1.intern(); 3 System.out.println( s1==s1.intern() ); 4 System.out.println( s1+" "+s2 ); 5 System.out.println( s2==s1.intern() );
结果:
false kvill kvill true
在这个类中我们没有声名一个”kvill”常量,所以常量池中一开始是没有”kvill”的,当我们调用s1.intern()后就在常量池中新添加 了一个”kvill”常量,原来的不在常量池中 的”kvill”仍然存在,也就不是“将自己的地址注册到常量池中”了。
5. 关于equals()和==:
s1==s1.intern()为false说明原来的“kvill”仍然存在;
s2现在为常量池中“kvill”的地址,所以有s2==s1.intern()为true。
这个对于String简单来说就是比较两字符串的Unicode序列是否相当,如果相等返回true;而==是比较两字符串的地址是否相同,也就是是否是同一个字符串的引用。
6. 关于String是不可变的
这一说又要说很多,大家只要知道String的实例一旦生成就不会再改变了,比如说:String str=”kv”+”ill”+” “+”ans”;
就是有4个字符串常量,首先”kv”和”ill”生成了”kvill”存在内存中,然后”kvill”又和” “ 生成 ”kvill “存在内存中,最后又和生成了”kvill ans”;并把这个字符串的地址赋给了str,就是因为String的“不可变”产生了很多临时变量,这也就是为什么建议用StringBuffer的原 因了,因为StringBuffer是可改变的
StringBuilder 类是字符串生成器,新创建的StringBuilder对象初始化容量为16个字符,也可以自己制定初始化长度,可以动态的执行添加,删除,插入等操作;如果附加的字符超过了制定的长度,StringBuilder将自动增加长度来容纳被附加的字符。
String(出现JDK1.0时代) 不可变字符序列
StringBuffer(出现JDK1.0时代) 线程安全的可变字符序列
StringBuilder(出现JDK1.5时代) 非线程安全的可变字符序列
1 public class Jerque{
2 public static void main(String[] args){
3 String str = "";
4 long startTime = System.currentTimeMillis();
5 for (long i = 0;i<1000000 ;i++ ) {
6 str = str +1;
7 }
8 long endTime = System.currentTimeMillis();
9 long time = endTime - startTime;
10 System.out.println("String消耗时间:"+time);
11 long startTime1 = System.currentTimeMillis();
12 StringBulilder stringBuilder = new StringBulilder();
13 for (long j = 0;j<1000000 ;j++ ) {
14 stringBuilder.append(j);
15 }
16 long endTime1 = System.currentTimeMillis();
17 time1 = endTime1- startTime1;
18 System.out.println("stringBuilder消耗时间是:"+time1);
19 }
20 }
时间分别为:162933 33
StringBuilder是一个可变的字符序列,提供与StringBuffer兼容的API,但不保证与之同步,
在字符串缓存被单个线程使用的要比StringBuffer快,但是StringBuilder在多线程中是不安全的,
这个时候就要用到StringBuffer来实现。
看看String类的部分源代码:
1 public final class String{
2 private final char value[];
3 public String(String orginal){
4 把源字符串orginal切割为字符数组并赋值给value[]
5 }
6 }
StringBuffer的部分源代码:
1 public final class StringBuffer extends AbstractStringBuilder{
2 char value[]; //继承父类AbstractStringBuilder的value[]
3 public StringBuffer(String str){
4 super(str.length()+16); //继承父类的构造器,并且创建大小为str.length()+16的数组
5 append(str); //将字符串切割为字符并加入到value[]中
6 }
7 }
String和StringBuffer中的value[]都用于存储字符序列
(1) String中的是常量(final)数组,只能被赋值一次。
(2) StringBuffer中的value[]就是一个很普通的数组,而且可以通过append()方法将新字符串加入value[]末尾。这样也就改变了value[]的内容和大小了。
本质上是指对象中的value[]字符数组可不可变,而不是对象引用可不可变。
下面说说线程安全问题(StringBuilder和StringBuffer)
StringBuffer允许多线程进行字符操作。这是因为在源代码中StringBuffer的很多方法都被关键字synchronized 修饰,而StringBuilder没有。
有多线程编程经验的程序员应该知道synchronized。这个关键字是为线程同步机制 设定的。
synchronized的含义:
每一个类对象都对应一把锁,当某个线程A调用类对象O中的synchronized方法M时,必须获得对象O的锁才能够执行M方法,否则线程A阻塞。一旦线程A开始执行M方法,将独占对象O 的锁。使得其它需要调用O对象的M方法的线程阻塞。只有线程A执行完毕,释放锁后。那些阻塞线程才有机会重新调用M方法。这就是解决线程同步问题的锁机制。
了解了synchronized的含义以后,大家可能都会有这个感觉。多线程编程中StringBuffer比StringBuilder要安全多了 ,事实确实如此。如果有多个线程需要对同一个字符串缓冲区进行 操作的时候,StringBuffer应该是不二选择。
注意:是不是String也不安全呢?事实上不存在这个问题,String是不可变的。线程对于堆中指定的一个String对象只能读取,无法修改。试问:还有什么不安全的呢?
StringBuilder的常用方法:
1、StringBuilder append(String str)方法:将参数str指定的字符串追加到字符串上生成器中;
2、StringBuilder append(StringBuffer sb) :将参数sb指定的字符串缓存StringBuilder的值追加到字符串生成器中;
3、StringBuilder insert(int offset,String str):offset字符串添加的小标索引位置;str 添加的字符串;
4、StringBuilder delete(int start,int end):移除字符串生成器中的子字符串,从start开始,到end结束;
5、StringBuilder toString():将字符串生成器的值转换为字符串
将字符串转换为Unicode编码:
1 public class CharacterUnicode{
2 public static void main(String[] args){
3 String text = "成都耕者信息技术有限公司";
4 char[] charArray = text.toCharArray();
5 StringBulilder builder = new StringBuilder();
6 for (char c: charArray) {
7 builder.append((int)c+" ");
8 }
9 System.out.println("成都耕者信息技术有限公司的Unicode编码是:");
10 System.out.println(builder.toString());
11 }
12 }
去掉字符串中中重复字符:
1 public class SBDelete{
2 public static void main(String[] args){
3 String s = "命运如同命运";
4 StringBulilder sb = new stringBuilder(s);
5 System.out.println("原来的字符串上是:"+sb);
6 System.out.println("原文的字符串长度:"+sb.length());
7 for (int i = 0;i<sb.length() ;i++ ) {
8 for (int j = i+1;sb.length() ;j++ ) {
9 if (sb.charAt(i)==sb.charAt(j)) {
10 sb.deleteCharAt(j);
11 }
12 }
13 }
14 System.out.println("现在的字符串是:"+sb);
15 System.out.println("现在的字符串长度是:"+sb.length());
16 }
17 }