Fork me on GitHub

JavaSE| String常用方法

字符串

* java.lang.String类型:字符串类型
 * 1、String类型是final修饰,不能被继承的
 * 2、Java 程序中的所有字符串字面值(如 "abc" )都作为此类的实例实现。
 *     简单的说,就是程序中的所有""构成的都是String的对象,只不过他们是字符串常量对象。
 * 
 *  比较特殊的空字符串常量对象:"",它的长度为0
 *     
 * 3、所有的 字符串都是常量;它们的值在创建之后不能更改。
 * 简单理解就是String对象是不可变的,一旦修改(拼接、截取、替换...)一定会产生新的字符串对象。
 * 
 * 4、因为 String 对象是不可变的,所以可以共享。 字符串常量对象是共享的,存在字符串的常量池中。
 * 
 * 字符串常量池在JVM内存的哪个部分:
 * JDK1.6:方法区
 * JDK1.7:堆中单独开辟一块空间用于存储字符串的常量
 * JDK1.8:从堆中又挪出来,挪到了“元空间”
 * 
 * 5、字符串对象中如何存储字符串的内容
 * 内部使用一个char[]数组来存储的
 * 
 * "hello" -> {'h','e','l','l','o'}
 * 
 * 字符串对象不可变有很多原因:(1value数组是final修饰的,无法创建新的value数组
 *                       (2String类型中没有提供修改value数组的元素的方法
 */

String s3 = new String ( " hello " ) ;   //这里有两个对象,一个是"hello"字符串常量对象,在常量池;另一个是new的字符串对象,在堆里边。

字符串的比较

  1 )  == 比较地址
  2 )  equals 比较字符串内容

        String s1 = "hello";
        String s2 = "atguigu";
        String s3 = "helloatguigu";//常量池
        
        String s4 = "hello" +"atguigu";//编译期间就可以确定的常量 拼接 结果还在常量池
        String s5 = s1 + "atguigu";//编译期间s1是变量,只要变量参与了,结果就在堆
        String s6 = s1 + s2;//编译期间s1是变量,只要变量参与了,结果就在堆
        
        System.out.println(s3 == s4);//true
        System.out.println(s3 == s5);//false ;如果s1、s2用final修饰,s5编译期间s1是常量,拼接 结果还在常量池,变为true;
        System.out.println(s3 == s6);//false ;如果s1和s2用final修饰,s6//编译期间s1和s2都是常量,拼接 结果还在常量池,结果变为true。


        String s4 = s1 + s2; 
        System.out.println(s3 == s4);//false
        System.out.println(s3.equals(s4));//true
        String s4 = (s1+ s2).intern();//把结果存到常量池里,这样s3 == s4就为true了。   
String a = "abc", b = "abc";
a == b  -->true  因为这里”abc”和”abc”是常量,是共享,在字符串的常量池中,是同一个对象
a.equals(b) -->true

 

创建对象| 判断对象是否为空

        String s1;//变量声明,但是未初始化,要先初始化才能使用。
        String s2 = null;//变量声明并且初始化为null
        //s1和s2是没有字符串的对象

        String s3 = "";//常量池中创建字符串对象,是非空的字符串对象。
        String s4 = new String();//堆中创建字符串对象

        String s0 = "Hello"; //存储在字符串的常量池中
        String s11 = new String();
        String s22 = new String("Hello"); //创建对象
        System.out.println(s11.length()); //0

判断是否为空的4种方法:
s3
!= null && !s3.isEmpty() s3 != null && s3.length()!=0 s3 != null && !s3.equals("") //前面加s3!=null是为了避免s3.equals()空指针异常 !"".equals(s3)

 

字符串常用系列方法一

* 字符串的常用方法系列1:
 * (1)int length():返回字符串对象的长度,其实就内部value数组的长度; s.length( );
 * (2)String toUpperCase():把当前字符串中的字符转成大写,返回一个新的字符串对象  s.toUpperCase()
 * (3)String toLowerCase():把当前字符串中的字符转成小写,返回一个新的字符串对象  s.toLowerCase()
 * (4)字符串比较:boolean equals()  严格区分大小写
 *             boolean equalsIgnoreCase():不区分大小写
 * (5)String trim():去掉前后空格     s.trim()
    s.trim不能去掉全角空格,只能去掉半角空格

    replaceAll替换为半角再trim
* (6)String concat():完全等价于 +  如 s1 + s2  <==>  s1.concat(s2)
 * (7)判断字符串是否为空
 * !"".equals(字符串)  非空
 * "".equals(字符串)  空字符串  ; 如 "".equals( "abc" ) 为false; “ ”,加了个空格就不是空的了。
 * 

字符串与字符数组的转换

* 字符串的常用方法系列之二:
 * 
 * 字符串与字符数组之间的转换:
 * 1、把字符数组 -> 字符串
 * String(char[] arr):用整个数组构建字符串
 * String(char[] arr, int start, int count):取arr[start]开始的count个字符构造字符串
 * 
char[] arr = {'h','e','l','l','o'};
String str = new String(arr); //hello
String str2 = new String(arr,2,2); //从下标为2的开始取,截取长度为2,即 ll
System.out.println(str2);


 * 2、把字符串转成字符数组:
 * char[] toCharArray()

String strr = "Hello";
char[] charArray = str.toCharArray();

 * 思想:
 * String中用char[] value存
 * toCharArray()复制了一个新数组,原因是保证字符串的不可变性
 * 
 * 
 * 3、取第几个字符
 * charAt(index)
//input.next()返回的String类型的对象
char gender = input.next().charAt(0);

 

编码与解码

* String的常用方法系列三:   字符:给人看的;   字节:给机器识别
  在开发中,输出到“文件”,在网络中传输,都要把“字符”->"字节"
 * 如果对方接收到数据,从"文件”中读取,显示给用户看,又得“字节”-“字符”
 * 
 * 编码:把字符-->字节
 * 编码方式:GB2312,GBK,UTF-8,ISO8859-1
 * 编码的方法:
 * byte[] getBytes():按照平台默认的字符编码
 * byte[] getBytes(String charsetName) :按照指定的字符编码方式进行编码
    byte[] bytes = str.getBytes();
    byte[] bytes = str.getBytes("GBK");   ---->>>  System.out.println(Arrays.toString(bytes)); 调用字符串的toString方法。
    byte[] bytes = str.getBytes("ISO8859-1");//无法表示中文
 * 

 * 解码:把字节-->字符
 * 解码的方法:
 * String(byte[] data):按照平台默认的字符编码
 * String(byte[] data,String charsetName):按照指定的字符编码方式进行解码

byte[] arr = {-55, -48, -71, -24, -71, -56}; //要解码成字符
String string = new String(arr,"GBK");

System.out.println(new String(str.getBytes("ISO8859-1"),"ISO8859-1"));//?,不能表示中文,如果str表示中文,会乱码,中文有几个就编码几个。
System.out.println(new String(str.getBytes("UTF-8"),"UTF-8"));//以UTF-8编码,以UTF-8解码。
* GBK:一个汉字对应2个字节 * UTF-8:一般一个汉字对应3个字节 * ASCII码表中的字符是在任意字符集中都兼容的,这些个只占1个字节
乱码--->>>字符编码与解码不一致; 丢/多字节;

 

字符串以..开头,以..结尾

* String的常用方法系列之四:
 *   判断字符串是否以xx开头,结尾
 * 
 * boolean startsWith(xx)  如 str.startsWith("java"); 判断str字符串是否以java开头的
 * boolean endsWith(xx)

字符串的查找

* String的常用方法系列之五:
 * 在字符串中查找:
 * (1)boolean contains(str):是否包含                                 s1.contains(s2);
 * (2)int indexOf(str):如果存在就返回从左到右第一次出现的下标,否则返回-1   int index = str1.indexOf(str2);
 * (3)int lastIndexOf(str):如果存在就返回最后一次出现的下标,否则返回-1
 */

字符串的截取

* 字符串的常用方法系列六:
 * 字符串的截取
 * 
 * substring( 起始下标 )         --->>   [ 起始下标,最后 ]
 * substring( 起始下标,结束下标 ) --->>  [ 起始下标,结束下标 )
 */

String fileName = "d:/atguigu/java1111/code/Hello.java";
int start = fileName.lastIndexOf("/") + 1;
int end = fileName.lastIndexOf(".");
int index = fileName.lastIndexOf("/") +1;
String name = fileName.substring(start, end); 

//String substring = fileName.substring(index); //截取从inex到最后一个的字符串,包含index  
System.out.println(name);

正则表达式

* 几个和正则相关的String方法:* 正则表达式的目的是为了按照某个格式要求去匹配字符串
 * 
 * 1、boolean  matches(正则):判断当前字符串是否满足某种正则(规则)
 * 2、String replaceAll(正则,新值):把当前字符串中的复合这个“正则”部分替换为“新值”
 * 3、String replaceFirst(正则,新值):把当前字符串中的找到的第一个复合这个“正则”部分替换为“新值”
 * 4、String[] split(正则):按照要求进行拆分
 * 
 * 
 * 和正则无关的替换方法:
 * (1)String replace(char oldChar, char newChar) :注意形参是char
 * (2)String replace(CharSequence target, CharSequence replacement) :形参是字符虚列,就是字符串
 */

 

  //str中是否全是数字组成
        boolean b = str.matches("\\d+");//原因,在Java \ 也是转义

    //boolean b = str.matches("(\\p{Alpha})+"); // + 代表全部,str中是否全是“字母”组成
        
        boolean b = str.matches("(\\p{Lower}|\\p{Upper})+"); //str中字母不区分大小写,包含数字会返回false
        System.out.println(b);

    String replace = str.replaceAll("\\d+", ""); //把str中的数字全部去掉
    String replace = str.replaceFirst("\\d+", ""); //只去掉第一个

    String str = "hello;world!java?string";
        //按照标点符号拆开
        String[] strings = str.split("\\p{Punct}");
        for (String string : strings) {
            System.out.println(string);
        }
    }


    String str = "hello|world|java|string";
        //按照|拆开
        String[] strings = str.split("\\|");


    String str = "hello.world.java.string";
        //按照.拆开
        String[] strings = str.split("\\.");



    String str = "张三:89;李四:67;王五:90";
        
        //先按照;拆开三个同学
        String[] persons = str.split(";");
        Student[] all = new Student[persons.length];
        for (int i = 0; i < persons.length; i++) {
            //在按照:拆开姓名和成绩
            String[] split = persons[i].split(":");
//                split[0]学生姓名
//                split[1]学生成绩
                all[i] =  new Student(split[0], Integer.parseInt(split[1]));
        }
        
        for (Student student : all) {
            System.out.println(student);
        }

 

可变字符序列StringBuilder和StringBuffer

* java.lang.String:对象不可变,一旦变就会有新对象
 * 字符串的兄弟类:可变字符序列
 * java.lang.StringBuffer:线程安全的可变字符序列。旧的。效率相对低。
 * java.lang.StringBuilder:线程不安全的可变字符序列。新的JDK1.5效率更高
 * 
 * StringBuffer和StringBuilder的API是完全兼容,即方法签名一样,不一定的是一个适用于单线程,一个在适用于多线程。
 * 
 * StringBuffer和StringBuilder对象的创建必须通过new,和String的可以直接等于"xxx"不同
 * 
 * StringBuffer和StringBuilder的方法:
 * (1)append(xx):直接在value中修改,如果value长度不够了,会重写扩容为原来的2倍+2。默认的value长度为16
 * (2)insert(int offset, xx):即在字符串缓冲区的[offset]开始插入xx。如果value长度不够,也会扩容。
 * (3)delete(int start, int end):删除[start,end) 
 *    deleteCharAt(int index):删除指定位置的字符 
 * (4)reverse() 
 * (5)String toString()
 * ....
 * 
 * String中内部用final char[] value;
 * StringBuffer和StringBuilder的内部用:char[] toStringCache;
 * 

 

public class TeatStringBuffer {
    StringBuilder s = new StringBuilder(20);//如果指定了初始容量,就按指定的来
    
    @Test
    public void test1(){
        StringBuilder s = new StringBuilder();//默认创建了一个长度为16的char[]数组
        s.append("Hello").append("Worlld"); //直接修改的是s的字符串缓冲区对象
        System.out.println(s);
    }
    
    @Test
    public void test2(){
        StringBuilder s = new StringBuilder("HelloBeiJing");//如果指定了初始容量,就按指定的来
        s.deleteCharAt(0);
        s.reverse();
        System.out.println(s);
        
        
    }
    
View Code

 

String str = “I” + “love” + “java”;
String str = new String();
str = str.concat(“I”).concat(“love”).concat(“java”);

StringBuffer s = new StringBuffer();
s.append(“I”).append(“love”).append(“java”);
在单线程情况下,优先考虑StringBuilder,它效率高。只不过它在多线程情况下,线程不安全,可以使用StringBuffer,比String的拼接效率要高。
String对象是不可变的,而StringBuffer和StringBuilder是可变的字符序列。

 

考点:

1)方法的参数传递机制

x.append(y)修改的是x的value,是可以变

y=x;修改的y的地址,这个时候这个y和实参b不是通一个对象了

2)方法的引用传递:

实参给形参的是地址值,如果通过形参修改属性,实参会受影响,但是如果修改形参的地址,和实参就无关了。

public class Exam4 {
    public static void main(String[] args) {
        StringBuffer a = new StringBuffer("A");
        StringBuffer b = new StringBuffer("B");
        
        operate(a, b);
        
        System.out.println(a + "," + b);
    }
    
    public static void operate(StringBuffer x,StringBuffer y){
        x.append(y);
        y = x; //y=AB
    }
}
===>>AB,B

StringBuilder

内存是堆内存,但共享对象不是共享的,是独享对象---叫多例(多个对象多个实例);用StringBuilder,效率高;它是不会出现线程安全问题的;

public class TestString {
    public static void main(String[] args) { //main方法也可以多线程同时访问; 但永远不会出现多线程安全问题
        // StringBuilder, StringBuffer
        StringBuilder stringBuilder = new StringBuilder(); //
        for (int i = 0; i < 10000; i++){
            stringBuilder.append(i);
        }
        System.out.println(stringBuilder);
    }
}
View Code

 

对于java而言,String是不可变字符数组,所以无法避免空间的开销
顺带讲讲原因:源码如下
public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    /* The value is used for character storage. */
    private final char value[];
String底层使用的数据结构是 final修饰的字符数组
众所周知,final修饰的是常量,所以无法更改
但是对于String Buffer 或者 String Builder而言(这里举一个例子就好,因为他们都继承了AbstractStringBuilder)
 public final class StringBuffer
    extends AbstractStringBuilder
    implements java.io.Serializable, CharSequence
{

    /*
     * A cache of the last value returned by toString. Cleared
     * whenever the StringBuffer is modified.
     */
    private transient char[] toStringCache;

abstract class AbstractStringBuilder implements Appendable, CharSequence {
    /*
     * The value is used for character storage.
     */
    char[] value;
可以看到的是,底层数据结构仅仅是char[] value,只是一个char[]数组,所以可以进行改变

再来说说为什么String不可变的原因:
字符串常量池的需要
字符串常量池是Java堆内存中一个特殊的存储区域, 当创建一个String对象时,假如此字符串值已经存在于常量池中,则不会创建一个新的对象,而是引用已经存在的对象。(所谓的节省空间)
安全性
String被许多的Java类(库)用来当做参数,比如 网络连接地址URL,文件路径path, 假若String不是固定不变的,将会引起各种安全隐患。
String对象的hashcode问题
字符串不变性保证了hash码的唯一性,因此可以放心地进行缓存.这也是一种性能优化手段,意味着不必每次都去计算新的哈希码

 

posted @ 2018-12-06 19:34  kris12  阅读(391)  评论(0编辑  收藏  举报
levels of contents