String转换成Integer源码分析

我们经常为用到Integer.valueOf(String str)这个方法,如果字符串格式不对,这个方法会抛出一个系统异常NumberFormatException
这里我们就要分析一下这个方法,其中Byte,Short也是调用了Ingeter中的方法.
在Integer类中的定义如下:
public static Integer valueOf(String s) throws NumberFormatException
    {
return new Integer(parseInt(s, 10));
    }
这里因为parseInt方法返回的int型的,这里调用了一个构造函数产生了一个新的Integer实例.
这里关心的是parseInt方法,该方法代码如下:

public static int parseInt(String s, int radix)
throws NumberFormatException
{
if (s == null) {
throw new NumberFormatException("null");
}

if (radix < Character.MIN_RADIX) {
throw new NumberFormatException("radix " + radix +
" less than Character.MIN_RADIX");
}

if (radix > Character.MAX_RADIX) {
throw new NumberFormatException("radix " + radix +
" greater than Character.MAX_RADIX");
}

int result = 0;
boolean negative = false;
int i = 0, max = s.length();
int limit;
int multmin;
int digit;

if (max > 0) {
if (s.charAt(0) == '-') {
negative = true;
limit = Integer.MIN_VALUE;
i++;
} else {
limit = -Integer.MAX_VALUE;
}

if (i < max) {
digit = Character.digit(s.charAt(i++),radix);
if (digit < 0) {
throw NumberFormatException.forInputString(s);
} else {
result = -digit;
}
}
while (i < max) {
// Accumulating negatively avoids surprises near MAX_VALUE
digit = Character.digit(s.charAt(i++),radix);
if (digit < 0) {
throw NumberFormatException.forInputString(s);
}
if (result < multmin) {
throw NumberFormatException.forInputString(s); 异常1
}
result *= radix;
if (result < limit + digit) {
throw NumberFormatException.forInputString(s); 异常2
}
result -= digit;
}
} else {
throw NumberFormatException.forInputString(s);
}

if (negative) {
if (i > 1) {
return result;
} else { /* Only got "-" */
throw NumberFormatException.forInputString(s);
}
} else {
return -result;
}
}




很显然,该方法的第二个参数表示是基数(最常用的是十进制,还有十六机制,八进制等等).
如果字符串是空指针,直接抛出异常.
如果基础小于2或者大于36的话,抛出异常(这种情况一般不会出现,因为我们用的最多就是十进制的了).
如果是空字符串,也抛出异常,也就是max=0的情况了.
我们来关注下面的转换过程:
这里使用了Character中的静态方法digit,这个方法比较复杂,这里先说明它的功能:对于给定的基数,如果是合法的字符(可以转化为数字),返回该数字值,否则返回-1.比如digit('3',10)返回3,digit('a',10)返回-1.
这段程序看起来很简单,其实还真不容易看懂,这里先说明几个局部变量的含义吧:
result:记录返回值
negative:符号标志
i:字符串位置
s:字符串长度
limit:界限
multmin:也是一个界限
digit:当前字符表示的数字
先看第一个字符是否是'-'号,设定符号标志negative和极限值limit.
注意到limit一定是一个负值.
处理最高位,这里result保存的是负值,这样就可以对正负数统一处理.
关键就是这个while循环了,第一个if不用解释了,肯定是因为非法字符.
第二个if语句的含义:如果result小于multmin,会产生什么结果呢?
是不是一定会溢出呢?假设不会溢出,就是说结果必须>=limit.
result小于multmin,result至少应该位multmin-1,后面有result=result*radix=(multmin-1)*radix=multmin*radix-radix
该值肯定小于limit,其中multmin=limit/radix,注意这里都是负数.
所以假设不成里,如果result小于multmin的话,后面一定会溢出.
如果这里没有判断的话,溢出就麻烦了,正数也会变负数了.
第三个if语句的含义:在这条语句以前肯定没有溢出,但是有可能加上最后一位digit就溢出了,所以这个判断也是必要的.
后面的就比较好理解了,else是表示空字符串"".
如果是负数的还要看是否长度是1,就只是一个'-'号的情况.
如果是正数的话返回相反数就可以了.
这里有好多地方都有可能抛出异常,只要看明白了程序就知道这个异常是那条语句抛出的了,这里考虑溢出异常:异常1和异常2.
Ingeter.Max_VALUE=2147483647
下面的两条语句在不同的地方抛出异常.
Ingeter.valueOf("2147483648");这个在异常2抛出的.
Ingeter.valueOf("21474836471");这个在异常1抛出的.

这里简单的分析了String转化为Ingeter的过程,其实整个Ingeter类也就主要是这个方法了,Byte和Short都是调用这个方法的.
看看Byte的代码:
public static byte parseByte(String s, int radix)
throws NumberFormatException {
int i = Integer.parseInt(s, radix);
if (i < MIN_VALUE || i > MAX_VALUE)
     throw new NumberFormatException(
                "Value out of range. Value:\"" + s + "\" Radix:" + radix);
return (byte)i;
   }

了解这个方法后就再也不会为Integer.valueOf()产生的异常感到意外了,特别是在JSP中,因为参数都是String型的,转换的时候动不动就出现异常,你该知道怎么回事了吧.

posted @ 2011-11-06 00:54  _ccx  阅读(259)  评论(0编辑  收藏  举报