浅析Java源码之Math.random()

从零自学java消遣一下,看书有点脑阔疼,不如看看源码!(๑╹◡╹)ノ"""

​ JS中Math调用的都是本地方法,底层全是用C++写的,所以完全无法观察实现过程,Java的工具包虽然也有C/C++的介入,不过也有些是自己实现的。

​ 本篇文章主要简单阐述Math.random()的实现过程。

​ Math隶属于java.lang包中,默认加载。本身是一个final类,方法都是静态方法,所以使用的时候不需要生成一个实例,直接调用Math.XX就行了。

​ 一步一步观察该方法,首先是java.lang.Math:

public final class Math {
  // 大量静态变量与方法
  // ...
  
  private static Random randomNumberGenerator;

  private static synchronized void initRNG() {
    if (randomNumberGenerator == null) 
      randomNumberGenerator = new Random();
  }
  
  public static double random() {
    if (randomNumberGenerator == null) initRNG();
    return randomNumberGenerator.nextDouble();
  }
  
  // ...other
}

​ 这里面与random相关的操作有3个:

1、声明一个私有静态Random类randomNumberGenerator

2、若randomNumberGenerator未初始化,调用new Random()将其初始化

3、若randomNumberGenerator已经初始化,调用nextDouble方法并将其值返回

tips:synchronized关键字代表同步执行此方法,Java为多线程,所以为了保证randomNumberGenerator对象只被初始化一次,需要该关键字。比如两个线程同时调用了Math.random(),线程A发现rXX未被初始化,进入initRNG调用new Random()方法。此时线程B也发现了rXX未被初始化,但是initRNG是同步方法,所以挂起等待线程A执行完毕。当线程A执行完后把rXX初始化了,所以在initRNG中的if判断,线程B会直接返回。

​ 所以简单来讲,random方法会在第一次调用时生成一个randomNumberGenerator对象,并调用其nextDouble方法生成随机数,之后的调用就只要持续调用此方法返回随机数就行了。

​ 下面来看Random类是个什么鬼,来源于java.util.Random:

public class Random implements java.io.Serializable {
  // 静态变量
  /** use serialVersionUID from JDK 1.1 for interoperability */
  static final long serialVersionUID = 3905348978240129619L;

  private final AtomicLong seed;

  private final static long multiplier = 0x5DEECE66DL;
  private final static long addend = 0xBL;
  private final static long mask = (1L << 48) - 1;

  // constructor
  public Random() { this(++seedUniquifier + System.nanoTime()); }
  private static volatile long seedUniquifier = 8682522807148012L;

  public Random(long seed) {
    this.seed = new AtomicLong(0L);
    setSeed(seed);
  }

  // 设置种子
  synchronized public void setSeed(long seed) {
    seed = (seed ^ multiplier) & mask;
    this.seed.set(seed);
    haveNextNextGaussian = false;
  }

  // 产生大数字
  protected int next(int bits) {
    long oldseed, nextseed;
    AtomicLong seed = this.seed;
    do {
      oldseed = seed.get();
      nextseed = (oldseed * multiplier + addend) & mask;
    } while (!seed.compareAndSet(oldseed, nextseed));
    return (int)(nextseed >>> (48 - bits));
  }

  // 生成随机数
  public double nextDouble() {
    return (((long)(next(26)) << 27) + next(27))
      / (double)(1L << 53);
  }

  // 其他不关心的方法
  // nextBytes(bytes [])

  // nextInt

  // nextInt(int)

  // nextLong

  // nextBoolean

  // nextFloat

  // Serializable相关
}

​ 上述代码剔除了大量的注释,还有一些不需要关心的方法,本文只关注Math.random()调用相关方法。

​ 对于这个类,首先来看看它的构造函数,理论上new一个Random实例是需要一个long类型的整数作为参数,但是代码用了this使其默认调用new Random(long)这个构造函数。而在构造函数中又生成了一个新类并赋值给实例变量seed,关于这个AtomicLong类其实没啥好讲的,简单看一下就行:

public class AtomicLong extends Number implements java.io.Serializable {
  private static final long serialVersionUID = 1927816293512124184L;

  // valueOffset相关...

  // 实例变量
  private volatile long value;
  // 构造函数
  public AtomicLong(long initialValue) {
    value = initialValue;
  }
  public AtomicLong() {}
  // 方法
  public final long get() {
    return value;
  }
  public final void set(long newValue) {
    value = newValue;
  }
  // 这个也会用到 但是不用关心具体实现
  public final boolean compareAndSet(long expect, long update) {
    return unsafe.compareAndSwapLong(this, valueOffset, expect, update);
  }
  // 其余不需要关心(其实我也看不懂)的方法
}

​ 如果思想简单一点,可以看出这个类也很简单,初始化传参赋值,set设置,get获取,多简单!

​ 现在回到Random类的构造函数中,实例变量被赋值,类的value为初始化的0(后缀L代表这是一个long类型整数)。下一步调用setSeed,传入构造函数的long类型seed变量(不是seed类),其值为:

++seedUniquifier + System.nanoTime()
// private static volatile long seedUniquifier = 8682522807148012L(8.6825e+15);
// 2^52 ~ 2^53
// 写文章时测试 => System.nanoTime() => 13230650355964(1.323e+13);

​ 其中第一个变量为一个固定值,每次加1,另外一个为System.nanoTime(),该方法返回一个与当前时间相关的数字,具体我不关心。

​ 两个相加后,作为初始种子出传入setSeed方法中,方法第一步会对seed进行二次计算:

seed = (seed ^ multiplier) & mask;
// private final static long multiplier = 0x5DEECE66DL;(25214903917 => 2.5214e+10)
// 2^34 ~ 2^35
// private final static long mask = (1L << 48) - 1;(2^48-1 => 0111...1 => 2^48 = 2.8147+e14)

​ 此处进行的是位运算,这里不用关心具体数值,只关注可能得到的最大最小值。

​ ^ => 异或运算:3 ^ 4 => 011 ^ 100 = 111 => 7(不一样置1,否则置0)

​ 可以看出,两个数字异或运算,假设其中较大的二进制位数为n,结果一定是小于等于2n-1,比如34,4为100三位,所以结果一定小于等于2^3-1,即7。

​ & => 与运算:3 & 4 => 011 & 100 = 000 => 0(都为1置1,否则置0)

​ 可以看出,与运算的结果总是小于等于较小的那个数。

​ 这样来再来看之前的位运算:

seed(2^52 ~ 2^53) ^ multiplier(2^34 ~ 2^35) => 0 ~ (2^53-1)
(seed ^ multiplier)(0 ~ 2^53-1) & mask(2^48-1) => 0 ~ 2^48-1

​ 结论是种子的范围是在0 ~ 2^48-1之间。

​ 测试代码:

public class test {
  public static void main(String [] args){
    pro b = new pro();
    System.out.println(b.getValue());
    // 256403749474577
    // 256458702577093
    // 256431328421593
  }
}
class pro{
  long seed = 8682522807148012L + System.nanoTime();
  long multiplier = 0x5DEECE66DL;
  long mask = (1L << 48) - 1;
  long getValue(){
    return (seed ^ multiplier) & mask;
  }
}

​ 构造函数调用完后,现在来看nextDouble,这个方法除去位运算,本质上就是调用了两次next方法:

public double nextDouble() {
  return (((long)(next(26)) << 27) + next(27))
    / (double)(1L << 53);
}

​ 所以直接看next方法:

protected int next(int bits) {
  long oldseed, nextseed;
  AtomicLong seed = this.seed;
  do {
    oldseed = seed.get();
    nextseed = (oldseed * multiplier + addend) & mask;
  } while (!seed.compareAndSet(oldseed, nextseed));
  return (int)(nextseed >>> (48 - bits));
}

​ 方法内部声明了2个long类型种子:oldseed、nextseed,通过get方法取得之前位运算得到的seed赋值给oldseed,然后再次通过运算得到一个nextseed的值,并传给seed.compareAndSet(oldseed, nextseed)方法中。

​ 关于这个方法,源码里是这样的:

// java.util.concurrent.atomic.AtomicLong;
public class AtomicLong extends Number implements java.io.Serializable {
  public final boolean compareAndSet(long expect, long update) {
    return unsafe.compareAndSwapLong(this, valueOffset, expect, update);
  }
}
// sun.misc.Unsafe.java
public native boolean compareAndSwapLong(Object obj, long offset,long expect, long update);

​ 这个方法是个内部方法,也就是用C/C++实现的,所以有兴趣的自己去看源码,这里贴一个blog:

http://www.cnblogs.com/Mainz/p/3546347.html

​ 方法的用处简单讲也很简单,比较oldseed与内存中预期的值,如果符合,就将nextseed放进去。

​ 这里的运算也不管具体数值,oldseed * multiplier按最大计算会出现溢位,截取成long类型后的大小不确定,所以按照与运算这里的范围依然是0 ~ mask,即0 ~ 2^48-1。

​ 最后返回(int)(nextseed >>> (48 - bits)),这里对结果进行类型处理,贴一个类型范围图:

基本类型 最小值 最大值
byte -2^7 2^7 - 1
short -2^15 2^15 - 1
int -2^31 2^31 - 1
long -2^63 2^63 - 1
​ 若结果是大于int类型最大值,超出的部分会被直接截取砍掉。

​ 最后看nextDouble的计算式:

(((long)(next(26)) << 27) + next(27)) / (double)(1L << 53)

​ 传入的bits分别为26与27,这时返回的随机数为:

(int)(nextseed >>> 22) 与 (int)(nextseed >>> 21)

​ >>>为无符号右移,具体意思就不解释了。

​ 得到的结果范围大概是 0 ~ 2^26(27)-1,理论上在这里是不会超过int的最大值。

​ 当seed(测试代码中的tmp)为mask时,此时计算会达到最大值:

(((long)(1L << 53)-1 ) / (double)(1L << 53)

​ 测试代码:

public class test {
  public static void main(String [] args){
    testb bb = new testb();
    long a = (long)bb.getNext(26);
    long b = bb.getNext(27);
    double c = 1L << 53;
    double d = ((a<<27) +b)/c;
    // 0.99999999...
    System.out.println(d);
  }
}
class testb{
  long tmp = (1L<<48)-1;
  // long tmp = 0 => 0.0
  int getNext(int num){
    return (int)(tmp >>> (48 - num));
  }
}

​ 当测试代码中tmp为0时,计算结果为最小值0。

​ 每一次调用nextDouble,会生成不一样的seed,也就会返回不一样的数字。

​ 这样就是整个随机数生成过程。

​ 完结,撒花ヽ(゚∀゚)メ(゚∀゚)ノ

posted @ 2017-11-02 18:07  书生小龙  阅读(1228)  评论(0编辑  收藏  举报