3、引用类型

内容来自王争 Java 编程之美

1、Java 类型：基本类型 vs 引用类型

Java 中的数据类型可以分为两类：基本类型和引用类型

基本类型包括：整型（byte，short，int，long）、浮点型（float，double）、字符型（char）、布尔型（boolean）
引用类型包括类、接口、数组

接下来我们看下，这两种类型的数据在内存中是如何存储的

1.1、基本类型

public class Demo3_1 {

    public static void main(String[] args) {
        int a = 1;
        int b = 2;
        a = b;
    }
}

在上一节课中讲到，函数的局部变量都存储在栈上，所以，a 和 b 对应的内存单元在栈上，并且对应存储的值为 1 和 2
当执行 a = b 赋值操作时，将 b 对应内存单元中存储的值，赋值给 a 对应的内存单元，如下图所示

当然，基本类型变量并不一定存储在栈上，如下所示，变量是类的属性，变量作为对象的一部分，存储在堆上
不过，不管变量存储在哪里，存储结构是不变的（变量对应的内存单元直接存储数据本身）

public class Demo3_2 {

    private int a;
    private int b;

    public void change() {
        a = 1;
        b = 1;
        a = b;
    }
}

1.2、引用类型：对象的引用

public class Student {

    public int id;
    public int age;

    public Student(int id, int age) {
        this.id = id;
        this.age = age;
    }
}

Student stu = new Student(1, 3);

理解引用的关键是分清楚 "对象本身" 和 "对象的引用"，例如，上述代码中，stu 变量并非 Student 对象本身，而是 Student 对象的引用
它存储的是对象对应内存块的首地址，上述代码对应的内存结构如下所示，在图中，我们使用一个带箭头的指针，来形象化地表示对象的引用与对象本身之间的关系

Student stu1 = new Student(1, 3);
Student stu2 = new Student(2, 5);
stu1 = stu2;

在上述代码中，在执行 "stu1 = stu2" 之前，stu1 和 stu2 分别存储了两个不同对象对应内存块的首地址，如下图所示

执行 "stu1 = stu2" 相当于将 stu2 对应的内存单元中值，赋值给 stu1 对应的内存单元
也就是将 stu2 所引用的对象的首地址赋值给 stu1，stu1 和 stu2 引用相同的对象，如下图所示

也就是说，一个引用变量可以在不同阶段引用（指向）不同的对象，同一个对象也可以同时被多个引用变量所引用（指向）

上述代码比较简单，我们再来看个复杂一点的（对象中的属性为引用类型，而非基本类型），以加深对引用的理解，代码如下所示

public class Group {

    public int gradNo;
    public int classNo;

    public Group(int gradNo, int classNo) {
        this.gradNo = gradNo;
        this.classNo = classNo;
    }
}

public class Student {

    public int id;
    public int age;
    public Group group;

    public Student(int id, int age) {
        this.id = id;
        this.age = age;
    }
}

public class Demo3_3 {

    public static void main(String[] args) {
        Student stu = new Student(2, 5);
        stu.group = new Group(2, 3);
    }
}

1.3、引用类型：数组的引用

刚刚介绍的是对象的引用，现在，我们再来看下数组的引用

数组更加复杂，从数组中存储的数据的类型，我们可以将数组分为基本类型数组和对象数组
基本类型数组指数组中存储的元素是基本类型数据，对象数组指数组中存储的元素是对象
从维度，我们可以将数组分为一维数组、二维数组等

1.3.1、一维基本类型数组

我们先从最简单的一维基本类型数组看起，示例代码如下所示

int[] arr = new int[5];
arr[0] = 3;

上述代码对应的内存结构如下图所示，数组存储在一块连续的内存单元中，arr 是数组的引用而非数组本身，存储数组在内存中的首地址

1.3.2、一维对象数组

我们再来一下一维对象数组，示例代码如下所示

Student[] arr = new Student[3];
arr[0] = new Student(1, 1);
arr[1] = new Student(2, 2);

上述代码对应的内存存储结构如下图所示，arr 是数组的引用
数组中存储的是对象的引用而非对象本身，换句话说，其存储的是 Student 对象对应内存块的首地址

1.3.3、二维基本类型数组

上面讲解的是一维数组，我们再来看下二维数组

我们在《数据结构与算法之美》中讲到，二维数组中的数据是先行后列（或先列后行），顺序存储在一片连续的内存块中，类似一维数组的存储方式
实际上，每种编程语言都会根据自身语言的特点，对数组的实现方式做了调整
Java 中的二维数组不仅不是连续存储的，而且，第二维的长度还可以不同，我们举例来解释一下

int[][] arr = new int[3][];
arr[0] = new int[2];
arr[2] = new int[4];

1.3.4、二维对象数组

上面讲的是二维基本类型数组，我们再来看二维对象数组，示例代码如下所示

Student[][] arr = new Student[3][];

arr[0] = new Student[2];
arr[0][0] = new Student(2, 2);

arr[2] = new Student[3];
arr[2][1] = new Student(4, 4);
arr[2][2] = new Student(5, 5);

1.4、链表

很多数据结构与算法的初学者，会觉得链表代码很难理解，主要原因就是对引用的理解不透彻
有了以上对引用的学习，我们再来看下如下链表代码，是不是理解起来更加容易了呢？

public class Node {

    public int data;
    public Node next;

    public Node(int data, Node next) {
        this.data = data;
        this.next = next;
    }
}

public class Demo3_9 {

    public void traverse(Node head) {
        Node p = head;
        while (p != null) {
            System.out.println(p.data);
            p = p.next;
        }
    }

    public void delete(Node p) { // 删除 p 所指节点的下一个节点
        p.next = p.next.next;
    }
}

对于上述的代码，我们重点理解 "Node p = head"、"p = p.next"、"p.next = p.next.next"这三条语句

在 "Node p = head" 这条语句中，p、head 都是引用变量（在数据结构中，我们称之为 "指针"），并非节点本身，其存储的是节点的内存地址
执行完这条语句之后，p 和 head 存储的值相同，p 也指向 head 所指向的对象，也就是链表的头节点
在形象化表示中，我们用箭头来表示引用变量（指针）和节点之间的引用关系

我们再来看 "p = p.next"这条语句，"." 操作用来取引用变量所引用的对象的属性
"p = p.next" 这条语句表示：将 p 所引用的对象的 next 属性值赋值给 p，因为 next 属性也是引用变量，存储的是 p 所指节点的下一个节点的内存地址
所以，执行完这条语句之后，p 中存储的是下一个节点的地址，如下图所示

最后，我们来看最复杂的 "p.next = p.next.next" 语句
如果我们把 p 所指向的节点叫做当前节点，那么，p.next 存储的是下一个节点的地址，p.next.next 存储下下个节点的地址
执行这条语句会将下下个节点的地址，赋值给 p 所指节点的 next，于是，p.next 存储下下个节点的地址，在图中形象化为指向下下个节点

2、参数传递：值传递 vs 引用传递

掌握的引用类型数据在内存中的存储方式之后，我们再来看一个在面试中经常问到的一个问题：Java 中的参数传递是值传递（pass by value）还是引用传递（pass by reference）？

在回答这个问题之前，我们先来了解一下 Java 中的参数传递，我们还是分基本类型参数和引用类型参数来讲解

2.1、基本类型参数

public class Demo3_5 {

    public static void main(String[] args) {
        int a = 1;
        fa(a);
        System.out.println(a); // 输出 1
    }

    private static void fa(int va) {
        va = 2;
        System.out.println(va); // 输出 2
    }
}

在上述代码中，变量 a 保存在 main() 函数的栈帧中，va 相当于一个新的变量，其保存在 fa() 函数的栈帧中
fa() 函数不能访问 main() 函数栈帧中的数据，同理，main() 函数也不能访问 fa() 函数栈帧中的数据
通过参数传递，将变量 a 的值传递给参数 va，相当于执行了 "va = a" 语句，所以，在函数 fa() 中，对 va 进行重新赋值，并不会改变变量 a 的值

2.2、引用类型参数

public class Demo3_5 {

    public static void main(String[] args) {
        Student stu = new Student(1, 1);
        fa(stu);
        System.out.println(stu.age); // 输出 3
    }

    private static void fa(Student vstu) {
        vstu.age = 3;
    }
}

在上述代码中，通过 new 创建的 Student 对象存储在堆上，stu 是 Student 对象的引用，存储了 Student 对象的首地址，stu 存储在 main() 函数栈帧中
vstu 是一个引用类型的变量，存储在 fa() 函数栈帧中，通过参数，将 stu 中存储的值赋值给 vstu，就相当于执行了 "vstu = stu" 语句
根据前面对引用类型的讲解，执行这条赋值语句之后，vstu 对应内存单元中存储的数据跟 stu 对应内存单元中存储的数据一样，都是 Student 对象的首地址
也就是说，现在，vstu 和 stu 是同一个 Student 对象的引用

当我们在 fa() 函数中，执行 "vstu.age = 3" 这条语句时，直接修改了 Student 对象的属性值，而 Student 对象存储在堆上，不受函数作用域的影响，在函数内，对所引用的对象的属性的修改，在函数执行完成之后，仍然有效，所以，main() 函数中的 println() 函数的输出结果是修改之后的 age 值 3

我们再回过头去看刚刚留下的问题：Java 中的参数传递是值传递还是引用传递？

教科书版的答案是：值传递，实际上，从上面的讲解中，我们很难得出这样的结果
恰恰相反，Java 中的参数既可以是基本类型，也可以是引用类型，给人比较直接的感觉是：Java 既支持值传递也支持引用传递
如果读者只了解 Java 语言，确实很难理解为什么 Java 中的参数传递是值传递，因为值传递和引用传递的区分来源于 C++ 语言
而且，"引用传递" 其中的 "引用" 的含义，也不是指传递参数的类型是引用类型

在 C++ 中，我们可以通过 "&" 引用语法获取到一个变量的地址，也可以将一个变量的地址传递给函数，这样，在函数内对变量修改，函数结束之后，修改不会失效

#include <stdio.h>

void change(int &va) {
    va = 2;
}

int main(void) {
    int a = 1;
    change(a);
    printf("a = %d\n", a); // 输出 2
}

在上述代码中，在调用 change() 函数时，编译器会将 a 对应内存单元的地址传递给 va
编译器将 chang() 函数中的 "va = 2" 翻译为：将 2 存储到 va 中存储的地址对应的内存单元，而不是存储到 va 对应的内存单元，这样就实现了修改变量 a

C++ 这种传递参数的方式叫做引用传递，也就是尽管我们在调用函数时，感觉传递是变量本身，但实际上传递的却是变量的地址
你可能会说，Java 中的函数可以为引用类型，也可以传递对象的地址啊
从对象的角度来看，传递的确实是对象的地址，但从引用变量本身的角度来看，传递的是引用变量的值（也就是对象的地址）而非引用变量的地址
所以，从引用变量本身来看，即便传递的参数是引用类型，仍然是值传递，而非引用传递
这点不好理解，我们再举例解释一下

public class Demo3_6 {

    public static void main(String[] args) {
        Student stu = new Student(1, 1);
        fb(stu);
        System.out.println(stu.age); // 输出 1, stu 存储的地址未改变
    }

    private static void fb(Student vstu) {
        vstu = new Student(2, 2);
    }
}

从上述代码中，我们可以发现，即便传递的参数是引用类型的，我们也只能改变所引用的对象的属性，而不能改变引用变量本身的值（也就是无法指向新的对象）
所以，Java 的参数不管是基本类型，还是引用类型，从变量本身来看，传递的都是变量的值，因此，都是值传递的

3、数据判等：等号 vs equals() 方法

3.1、基本类型数据判等

基本类型判等比较简单，直接使用等号 ==，即可判定两个变量的值是否相等，也就是判定两个变量对应的内存单元中存储的数据是否相等

public class Demo3_7 {

    public static void main(String[] args) {
        int a = 123;
        int b = 123;
        System.out.println("a == b: " + (a == b)); // true
    }
}

3.2、引用类型数据判等

引用类型数据的判等，要比基本类型数据复杂的多，引用类型数据有两种判等方式：等号 == 和 equals() 方法

我们先来看用等号判等

实际上，不管是基本类型数据，还是引用类型数据，等号比较的都是变量对应的内存单元中存储的值是否相等
对于引用变量来说，等号就是判定两个引用变量中存储的地址是否相同，也就是判定两个引用变量所引用的对象是否是同一个

public class Demo3_7 {

    public static void main(String[] args) {
        Student stu1 = new Student(1, 1);
        Student stu2 = new Student(1, 1);
        Student stu3 = stu1;
        System.out.println("stu1 == stu2: " + (stu1 == stu2)); // false
        System.out.println("stu1 == stu3: " + (stu1 == stu3)); // true
    }
}

我们再来看用 equals() 方法判等

所有的 Java 类都默认继承自 Object 类，Object 类中的 equals() 方法的代码实现如下所示
也就是说，如果我们在 Java 类中没有重写 equals() 方法，那么使用 equals() 方法判等，就跟使用等号判等一样了

public boolean equals(Object obj) {
    return (this == obj);
}

不过，JDK 中的大部分类都重写了 equals() 方法，比如，Integer 类和 String 类的 equals() 方法的代码实现如下所示

// Integer 类的 equals() 方法
public boolean equals(Object obj) {
    if (obj instanceof Integer) {
        return value == ((Integer) obj).intValue();
    }
    return false;
}

// String 类的 equals() 方法
public boolean equals(Object anObject) {
    if (this == anObject) {
        return true;
    }
    if (anObject instanceof String) {
        String anotherString = (String) anObject;
        int n = value.length;
        if (n == anotherString.value.length) {
            char v1[] = value;
            char v2[] = anotherString.value;
            int i = 0;
            while (n-- != 0) {
                if (v1[i] != v2[i])
                    return false;
                i++;
            }
            return true;
        }
    }
    return false;
}

重写之后的 equals() 判定的不再是对象的 "址"（内存地址）是否相等，而是对象的 "值"（关键属性值）是否相等
比如，Integer 类的 equals() 方法判断的是其 int 值是否相等；String 类的 equals() 方法判断的是其 char 数组存储的是否是相同的字符
使用 equals() 方法对 Integer、String 类型进行判等的示例代码如下所示

Integer ia = new Integer(2314);
Integer ib = new Integer(2314);
System.out.println(ia == ib);      // false
System.out.println(ia.equals(ib)); // true

String sa = new String("abc");
String sb = new String("abc");
System.out.println(sa == sb);      // false
System.out.println(sa.equals(sb)); // true

根据使用习惯，等号一般用来判断对象是否 "相同"（同一个对象），equals() 一般用来判断对象是否 "相等"（业务含义上的相等，比如关键属性值相等）
因为 equals() 方法的默认实现是，使用等号判断对象是否 "相同"，跟其使用习惯不相符，所以，在平时的开发中，如果需要用到某个类的 equals() 方法，我们一般都会对它进行重写，将其逻辑改为判断对象是否 "相等"

public class Student {

    public int id;
    public int age;
    public Group group;

    public Student(int id, int age) {
        this.id = id;
        this.age = age;
    }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || this.getClass() != o.getClass()) return false;
        Student another = (Student) obj;
        return this.id == another.id;
    }
}

Student stu1 = new Student(1, 2);
Student stu2 = new Student(1, 2);
System.out.println(stu1 == stu2);      // 输出 false
System.out.println(stu1.equals(stu2)); // 输出 true

一般来说，重写类的 equals() 方法的同时，也要重写 hashcode() 方法
这是为什么呢？如何重写 hashcode() 方法？如果两个对象的 hashcode() 值冲突了，该怎么办？关于这些问题，我们留在后面的章节中讲解

4、访问安全：引用 vs 指针

Java 的诞生晚于 C / C++，所以，它借鉴了 C / C++ 中的很多语法特性，当然也摒弃了 C / C++ 中的很多不足
Java 摒弃了 C / C++ 中的指针语法，取而代之，引入了引用语法
尽管指针和引用存储的都是被指或被引用的内存块的地址，但引用却比指针在使用上安全很多

为了方便编写偏底层的代码（如驱动、操作系统），C / C++ 赋予指针灵活的操作内存的能力
C / C++ 允许指针越界访问，允许指针做加减运算，允许指针嵌套（指针的指针），甚至允许指针将一块内存重新解读为任意类型

正是因为 C / C++ 指针使用起来非常灵活，对内存的访问几乎没有什么限制，所以，对程序员编写代码的能力要求比较高，稍有不慎就会引入 bug，误操作不应该操作的内存区域，造成非常巨大的外延性破坏，从而引起安全问题

Java 语言设计的初衷就是简单易用，所以，权衡安全性和灵活性，Java 摒弃了灵活的指针，设计了更加安全的引用，也可以叫做安全指针
尽管指针和引用存储的都是某段内存的地址，但是，在用法上，引用是有限制的指针，没有了那么多酷炫的骚操作
Java 中的引用只能引用对象或数组，并且不能进行加减运算，而且，强制类型转化也只能发生在有继承关系的类之间
Java 中的引用使用起来非常简单，程序员不容易因此而引入 bug

5、课后思考题

1、你熟悉的编程语言是否支持引用传递？

支持引用传递的语言很少，比如 C / C++
大部分语言都不支持引用传递，比如 Java、Go

2、下面这段代码打印的结果是什么？为什么？

public class Demo3_10 {

    public static void main(String[] args) {
        Integer a = 10;
        f(a);
        System.out.println(a);
    }

    public static void f(Integer va) {
        va = 3;
    }
}

打印结果是 10
在 f() 函数中，执行 "va = 3" 会触发自动装箱，将 3 包装成一个 Integer 对象，然后再赋值给变量 va
Java 是值传递，因此，a 变量的值并不会被改变，仍然指向值为 10 的 Integer 对象

posted @ 2023-05-11 20:05 lidongdongdong~ 阅读(87) 评论(0) 编辑收藏举报

刷新页面返回顶部

lidong