Java编程的逻辑 (26) - 剖析包装类 (上)

本系列文章经补充和完善,已修订整理成书《Java编程的逻辑》,由机械工业出版社华章分社出版,于2018年1月上市热销,读者好评如潮!各大网店和书店有售,欢迎购买,京东自营链接http://item.jd.com/12299018.html


包装类

Java有八种基本类型,每种基本类型都有一个对应的包装类。

包装类是什么呢?它是一个类,内部有一个实例变量,保存对应的基本类型的值,这个类一般还有一些静态方法、静态变量和实例方法,以方便对数据进行操作。

Java中,基本类型和对应的包装类如下表所示:

基本类型 包装类
boolean
Boolean
byte
Byte
short
Short
int
Integer
long Long
float Float
double Double
char Character

包装类也都很好记,除了Integer和Character外,其他类名称与基本类型基本一样,只是首字母大写。

包装类有什么用呢?Java中很多代码(比如后续文章介绍的集合类)只能操作对象,为了能操作基本类型,需要使用其对应的包装类,另外,包装类提供了很多有用的方法,可以方便对数据的操作。

包装类的基本使用是比较简单的,但我们不仅会介绍其基本用法,还会介绍一些平时用的相对较少的功能,同时剖析其实现代码,内容比较多,我们会分三节来介绍,本节主要介绍各个包装类的基本用法及其共同点,后两节我们会进一步介绍高级功能,并剖析实现代码。

让我们逐步来介绍。

基本类型和包装类

我们先来看各个基本类型和其包装类是如何转换的,我们直接看代码:

Boolean

boolean b1 = false;
Boolean bObj = Boolean.valueOf(b1);
boolean b2 = bObj.booleanValue();

Byte

byte b1 = 123;
Byte byteObj = Byte.valueOf(b1);
byte b2 = byteObj.byteValue();

Short

short s1 = 12345;
Short sObj = Short.valueOf(s1);
short s2 = sObj.shortValue();

Integer

int i1 = 12345;
Integer iObj = Integer.valueOf(i1);
int i2 = iObj.intValue();

Long

long l1 = 12345;
Long lObj = Long.valueOf(l1);
long l2 = lObj.longValue();

Float

float f1 = 123.45f;
Float fObj = Float.valueOf(f1);
float f2 = fObj.floatValue();

Double

double d1 = 123.45;
Double dObj = Double.valueOf(d1);
double d2 = dObj.doubleValue(); 

Character

char c1 = 'A';
Character cObj = Character.valueOf(c1);
char c2 = cObj.charValue(); 

这些代码结构是类似的,每种包装类都有一个静态方法valueOf(),接受基本类型,返回引用类型,也都有一个实例方法xxxValue()返回对应的基本类型。

将基本类型转换为包装类的过程,一般称为"装箱",而将包装类型转换为基本类型的过程,则称为"拆箱"。装箱/拆箱写起来比较啰嗦,Java 1.5以后引入了自动装箱和拆箱技术,可以直接将基本类型赋值给引用类型,反之亦可,如下代码所示:

Integer a = 100;
int b = a;

自动装箱/拆箱是Java编译器提供的能力,背后,它会替换为调用对应的valueOf()/xxxValue(),比如说,上面的代码会被Java编译器替换为:

Integer a = Integer.valueOf(100);
int b = a.intValue();

每种包装类也都有构造方法,可以通过new创建,比如说:

Integer a = new Integer(100);
Boolean b = new Boolean(true);
Double d = new Double(12.345);
Character c = new Character('马');

那到底应该用静态的valueOf方法,还是使用new呢?一般建议使用valueOf。new每次都会创建一个新对象,而除了Float和Double外的其他包装类,都会缓存包装类对象,减少需要创建对象的次数,节省空间,提升性能,后续我们会分析其具体代码。

重写Object方法

所有包装类都重写了Object类的如下方法:

boolean equals(Object obj)
int hashCode()
String toString()

我们逐个来看下。

equals

equals用于判断当前对象和参数传入的对象是否相同,Object类的默认实现是比较地址,对于两个变量,只有这两个变量指向同一个对象时,equals才返回true,它和比较运算符(==)的结果是一样的。

但,equals应该反映的是对象间的逻辑相等关系,所以这个默认实现一般是不合适的,子类需要重写该实现。所有包装类都重写了该实现,实际比较用的是其包装的基本类型值,比如说,对于Long类,其equals方法代码是:

public boolean equals(Object obj) {
    if (obj instanceof Long) {
        return value == ((Long)obj).longValue();
    }
    return false;
}

对于Float,其实现代码为:

public boolean equals(Object obj) {
    return (obj instanceof Float)
           && (floatToIntBits(((Float)obj).value) == floatToIntBits(value));
}

Float有一个静态方法floatToIntBits(),将float的二进制表示看做int。需要注意的是,只有两个float的二进制表示完全一样的时候,equals才会返回true。在第5节的时候,我们提到小数计算是不精确的,数学概念上运算结果一样,但计算机运算结果可能不同,比如说,看下面代码:

Float f1 = 0.01f;
Float f2 = 0.1f*0.1f;
System.out.println(f1.equals(f2));
System.out.println(Float.floatToIntBits(f1));
System.out.println(Float.floatToIntBits(f2)); 

输出为:

false
1008981770
1008981771

也就是,两个浮点数不一样,将二进制看做整数也不一样,相差为1。

Double的equals方法与Float类似,它有一个静态方法doubleToLongBits,将double的二进制表示看做long,然后再按long比较。

hashCode

hashCode返回一个对象的哈希值,哈希值是一个int类型的数,由对象中一般不变的属性映射得来,用于快速对对象进行区分、分组等。一个对象的哈希值不能变,相同对象的哈希值必须一样。不同对象的哈希值一般应不同,但这不是必须的,可以有不同对象但哈希值相同的情况。

比如说,对于一个班的学生对象,hashCode可以是学生的出生月日,出生日期是不变的,不同学生生日一般不同,分布比较均匀,个别生日相同的也没关系。

hashCode和equals方法联系密切,对两个对象,如果equals方法返回true,则hashCode也必须一样。反之不要求,equal返回false时,hashCode可以一样,也可以不一样,但应该尽量不一样。hashCode的默认实现一般是将对象的内存地址转换为整数,子类重写equals时,也必须重写hashCode。之所以有这个规定,是因为Java API中很多类依赖于这个行为,尤其是集合中的一些类。

包装类都重写了hashCode,根据包装的基本类型值计算hashCode,对于Byte, Short, Integer, Character,hashCode就是其内部值,代码为:

public int hashCode() {
    return (int)value;
}

对于Boolean,hashCode代码为:

public int hashCode() {
    return value ? 1231 : 1237;
}

根据基类类型值返回了两个不同的数,为什么选这两个值呢?它们是质数,即只能被1和自己整除的数,后续我们会讲到,质数比较好,但质数很多,为什么选这两个呢,这个就不得而知了,大概是因为程序员对它们有特殊的偏好吧。

对于Long,hashCode代码为:

public int hashCode() {
    return (int)(value ^ (value >>> 32));
}

是高32位与低32位进行位异或操作。

对于Float,hashCode代码为:

public int hashCode() {
    return floatToIntBits(value);
}

与equals方法类似,将float的二进制表示看做了int。

对于Double,hashCode代码为:

public int hashCode() {
    long bits = doubleToLongBits(value);
    return (int)(bits ^ (bits >>> 32));
}

与equals类似,将double的二进制表示看做long,然后再按long计算hashCode。

关于equals和hashCode,我们还会在后续的章节中碰到,并进行进一步说明。

toString

每个包装类也都重写了toString方法,返回对象的字符串表示,这个一般比较自然,我们就不赘述了。

Comparable

每个包装类也都实现了Java API中的Comparable接口,Comparable接口代码如下:

public interface Comparable<T> {
    public int compareTo(T o);
}

<T>是泛型语法,我们后续文章介绍,T表示比较的类型,由实现接口的类传入。接口只有一个方法compareTo,当前对象与参数对象进行比较,在小于、等于、大于参数时,应分别返回-1,0,1。

各个包装类的实现基本都是根据基本类型值进行比较,不再赘述。对于Boolean,false小于true。对于Float和Double,存在和equals一样的问题,0.01和0.1*0.1相比的结果并不为0。

包装类和String

除了toString方法外,包装类还有一些其他与String相关的方法。

除了Character外,每个包装类都有一个静态的valueOf(String)方法,根据字符串表示返回包装类对象,如:

Boolean b = Boolean.valueOf("true");
Float f = Float.valueOf("123.45f");

也都有一个静态的parseXXX(String)方法,根据字符串表示返回基本类型值,如:

boolean b = Boolean.parseBoolean("true");
double d = Double.parseDouble("123.45");

都有一个静态的toString()方法,根据基本类型值返回字符串表示,如:

System.out.println(Boolean.toString(true));
System.out.println(Double.toString(123.45));

输出:

true
123.45 

对于整数类型,字符串表示除了默认的十进制外,还可以表示为其他进制,如二进制、八进制和十六进制,包装类有静态方法进行相互转换,比如:

System.out.println(Integer.toBinaryString(12345)); //输出2进制
System.out.println(Integer.toHexString(12345)); //输出16进制
System.out.println(Integer.parseInt("3039", 16)); //按16进制解析

输出为:

11000000111001
3039
12345

常用常量

包装类中除了定义静态方法和实例方法外,还定义了一些静态变量。

Boolean类型:

public static final Boolean TRUE = new Boolean(true);
public static final Boolean FALSE = new Boolean(false);

所有数值类型都定义了MAX_VALUE和MIN_VALUE,表示能表示的最大/最小值,比如,对Integer:

public static final int   MIN_VALUE = 0x80000000;
public static final int   MAX_VALUE = 0x7fffffff;

Float和Double还定义了一些特殊数值,比如正无穷、负无穷、非数值,如Double类:

public static final double POSITIVE_INFINITY = 1.0 / 0.0;
public static final double NEGATIVE_INFINITY = -1.0 / 0.0;
public static final double NaN = 0.0d / 0.0;

Number

六种数值类型包装类有一个共同的父类Number,Number是一个抽象类,它定义了如下方法:

byte byteValue()
short shortValue()                
int intValue()
long longValue()
float floatValue()
double doubleValue()

通过这些方法,包装类实例可以返回任意的基本数值类型。

不可变性

包装类都是不可变类,所谓不可变就是,实例对象一旦创建,就没有办法修改了。这是通过如下方式强制实现的:

  • 所有包装类都声明为了final,不能被继承
  • 内部基本类型值是私有的,且声明为了final
  • 没有定义setter方法

为什么要定义为不可变类呢?不可变使得程序可以更为简单安全,因为不用操心数据被意外改写的可能了,可以安全的共享数据,尤其是在多线程的环境下。关于线程,我们后续文章介绍。

小结

本节介绍了包装类的基本用法,基本类型与包装类的相互转换、自动装箱/拆箱、重写的Object方法、Comparable接口、与String的相互转换、常用常量、Number父类,以及包装类的不可变性。从日常基本使用来说,除了Character外,其他类介绍的内容基本就够用了。

但Integer和Long中有一些关于位操作的方法,我们还没有介绍,Character中的大部分方法我们也都没介绍,它们的一些实现原理我们也没讨论,让我们在接下来的两节中继续探索。

----------------

未完待续,查看最新文章,敬请关注微信公众号“老马说编程”(扫描下方二维码),从入门到高级,深入浅出,老马和你一起探索Java编程及计算机技术的本质。用心写作,原创文章,保留所有版权。

-----------

更多好评原创文章

计算机程序的思维逻辑 (1) - 数据和变量

计算机程序的思维逻辑 (5) - 小数计算为什么会出错?

计算机程序的思维逻辑 (6) - 如何从乱码中恢复 (上)?

计算机程序的思维逻辑 (8) - char的真正含义

计算机程序的思维逻辑 (12) - 函数调用的基本原理

计算机程序的思维逻辑 (17) - 继承实现的基本原理

计算机程序的思维逻辑 (18) - 为什么说继承是把双刃剑

计算机程序的思维逻辑 (19) - 接口的本质

计算机程序的思维逻辑 (20) - 为什么要有抽象类?

计算机程序的思维逻辑 (21) - 内部类的本质

计算机程序的思维逻辑 (23) - 枚举的本质

计算机程序的思维逻辑 (24) - 异常 (上)

计算机程序的思维逻辑 (25) - 异常 (下)

 

posted @ 2016-07-14 09:52  老马说编程  阅读(2822)  评论(3编辑  收藏  举报