JVM如何理解Java泛型类(转)

一个很典型的泛型(generic)代码。T是类型变量，可以是任何引用类型：

public class Pair<T>{  
       private T first=null;  
       private T second=null;  
  
       public Pair(T fir,T sec){  
            this.first=fir;  
        this.second=sec;  
       }  
       public T getFirst(){  
             return this.first;  
       }  
       public T getSecond(){  
             return this.second;  
       }  
       public void setFirst(T fir){  
         this.first=fir;  
       }  
}

1、Generic class 创建对象

            Pair<String> pair1=new Pair("string",1);           ...①
            Pair<String> pair2=new Pair<String>("string",1)    ...②

有个很有趣的现象:  ①代码在编译期不会出错，②代码在编译期会检查出错误。
这个问题其实很简单
      (1) JVM本身并没有泛型对象这样的一个特殊概念。所有的泛型类对象在编译器会全部变成普通类对象（这一点会在下面详细阐述）。
      比如①,②两个代码编译器全部调用的是 Pair(Object fir, Object sec)这样的构造器。

因此代码①中的new Pair("string",1)在编译器是没有问题的，毕竟编译器并不知道你创建的Pair类型中具体是哪一个类型变量T，而且编译器肯定了String对象和Integer对象都属于Object类型的。

但是一段运行pair1.getSecond()就会抛出ClassCastException异常。这是因为JVM会根据第一个参数"string"推算出T类型变量是String类型，这样getSecond也应该是返回String类型，然后编译器已经默认了second的操作数是一个值为1的Integer类型。当然就不符合JVM的运行要求了，不终止程序才怪。

(2) 但代码②会在编译器报错，是因为new Pair<String>("string",1)已经指明了创建对象pair2的类型变量T应该是String的。所以在编译期编译器就知道错误出在第二个参数Integer了。

小结一下：
创建泛型对象的时候，一定要指出类型变量T的具体类型。争取让编译器检查出错误，而不是留给JVM运行的时候抛出异常。

2、JVM如何理解泛型概念 —— 类型擦除
    事实上，JVM并不知道泛型，所有的泛型在编译阶段就已经被处理成了普通类和方法。
    处理方法很简单，我们叫做类型变量T的擦除(erased) 。
    无论我们如何定义一个泛型类型，相应的都会有一个原始类型被自动提供。原始类型的名字就是擦除类型参数的泛型类型的名字。
         如果泛型类型的类型变量没有限定(<T>) ，那么我们就用Object作为原始类型；
         如果有限定(<T extends XClass>)，我们就XClass作为原始类型；
         如果有多个限定(<T extends XClass1&XClass2>)，我们就用第一个边界的类型变量XClass1类作为原始类型；
    比如上面的Pair<T>例子，编译器会把它当成被Object原始类型替代的普通类来替代。

//编译阶段：类型变量的擦除  
public class Pair{  
       private Object first=null;  
       private Object second=null;  
  
       public Pair(Object fir,Object sec){  
           this.first=fir;  
           this.second=sec;  
       }  
      public Object getFirst(){  
           return this.first;  
      }  
      public void setFirst(Object fir){  
           this.first=fir;  
      }  
   }

3、泛型约束和局限性—— 类型擦除所带来的麻烦

(1) 继承泛型类型的多态麻烦。（—— 子类没有覆盖住父类的方法）

看看下面这个类SonPair

class SonPair extends Pair<String>{  
          public void setFirst(String fir){....}  
}

很明显，程序员的本意是想在SonPair类中覆盖父类Pair<String>的setFirst(T fir)这个方法。但事实上，SonPair中的setFirst(String fir)方法根本没有覆盖住Pair<String>中的这个方法。
原因很简单，Pair<String>在编译阶段已经被类型擦除为Pair了，它的setFirst方法变成了setFirst(Object fir)。那么SonPair中setFirst(String)当然无法覆盖住父类的setFirst(Object)了。

这对于多态来说确实是个不小的麻烦，我们看看编译器是如何解决这个问题的。

编译器 会自动在 SonPair中生成一个桥方法(bridge method ) ： 
           public void setFirst(Object fir){
                   setFirst((String) fir)
            }

这样,SonPair的桥方法确实能够覆盖泛型父类的setFirst(Object) 了。而且桥方法内部其实调用的是子类字节setFirst(String)方法。对于多态来说就没问题了。

问题还没有完，多态中的方法覆盖是可以了，但是桥方法却带来了一个疑问：

现在，假设我们还想在 SonPair 中覆盖getFirst()方法呢？

class SonPair extends Pair<String>{  
      public String getFirst(){....}  
}

由于需要桥方法来覆盖父类中的getFirst，编译器会自动在SonPair中生成一个 public Object getFirst()桥方法。
但是，疑问来了，SonPair中出现了两个方法签名一样的方法(只是返回类型不同)：

            ①String getFirst()   // 自己定义的方法
            ②Object getFirst()  //  编译器生成的桥方法

难道，编译器允许出现方法签名相同的多个方法存在于一个类中吗？

      事实上有一个知识点可能大家都不知道：
      ① 方法签名确实只有方法名+参数列表。这毫无疑问！
      ② 我们绝对不能编写出方法签名一样的多个方法。如果这样写程序，编译器是不会放过的。这也毫无疑问！
      ③ 最重要的一点是：JVM会用参数类型和返回类型来确定一个方法。一旦编译器通过某种方式自己编译出方法签名一样的两个方法(只能编译器自己来创造这种奇迹，我们程序员却不能人为的编写这种代码)。JVM还是能够分清楚这些方法的，前提是需要返回类型不一样。

(2) 泛型类型中的方法冲突

//在上面代码中加入equals方法  
public class Pair<T>{  
      public boolean equals(T value){  
            return (first.equals(value));  
      }  
}

这样看似乎没有问题的代码连编译器都通过不了：

【Error】 Name clash: The method equals(T) of type Pair<T> has the same erasure as equals(Object) of type Object but does not override it。

编译器说你的方法与Object中的方法冲突了。这是为什么?

开始我也不太明白这个问题，觉得好像编译器帮助我们使得equals(T)这样的方法覆盖上了Object中的equals(Object)。经过大家的讨论，我觉得应该这么解释这个问题？

首先、我们都知道子类方法要覆盖，必须与父类方法具有相同的方法签名（方法名+参数列表）。而且必须保证子类的访问权限>=父类的访问权限。这是大家都知道的事实。

然后、在上面的代码中，当编译器看到Pair<T>中的equals(T)方法时，第一反应当然是equals(T)没有覆盖住父类Object中的equals(Object)了。

接着、编译器将泛型代码中的T用Object替代（擦除）。突然发现擦除以后equals(T)变成了equals(Object)，糟糕了，这个方法与Object类中的equals一样了。基于开始确定没有覆盖这样一个想法，编译器彻底的疯了(精神分裂)。然后得出两个结论：①坚持原来的思想：没有覆盖。但现在一样造成了方法冲突了。 ②写这程序的程序员疯了(哈哈)。

再说了，拿Pair<T>对象和T对象比较equals，就像牛头对比马嘴，哈哈，逻辑上也不通呀。

(3) 没有泛型数组一说

      Pair<String>[] stringPairs=new Pair<String>[10];
      Pair<Integer>[] intPairs=new Pair<Integer>[10];

这种写法编译器会指定一个Cannot create a generic array of Pair<String>的错误

我们说过泛型擦除之后，Pair<String>[]会变成Pair[]，进而又可以转换为Object[];

假设泛型数组存在，那么

            Object[0]=stringPairs[0]; Ok
            Object[1]=intPairs[0]; Ok

这就麻烦了，理论上将Object[]可以存储所有Pair对象，但这些Pair对象是泛型对象，他们的类型变量都不一样，那么调用每一个Object[]数组元素的对象方法可能都会得到不同的记过，也许是个字符串，也许是整形，这对于JVM可是无法预料的。

记住：数组必须牢记它的元素类型，也就是所有的元素对象都必须一个样，泛型类型恰恰做不到这一点。即使Pair<String>,Pair<Integer>... 都是Pair类型的，但他们还是不一样。

总结：泛型代码与JVM
    ① 虚拟机中没有泛型，只有普通类和方法。
    ② 在编译阶段，所有泛型类的类型参数都会被Object或者它们的限定边界来替换。(类型擦除)
    ③ 在继承泛型类型的时候，桥方法的合成是为了避免类型变量擦除所带来的多态灾难。

posted on 2013-10-05 16:13 ggjucheng 阅读(10302) 评论(2) 收藏举报

刷新页面返回顶部

简单，可复制

公告