Object类默认hashCode方法解析

2014-06-16 | 分类 Java | 标签 JVM

在Java中，计算对象默认的hash值的方法在synchronizer.cpp文件中。对象的hash是在第一次使用时，即首次调用hashCode方法时进行计算，并将hash值存储在对象的Mark Word中。

类java.lang.Object#hashCode() 方法是native，最终调用到ObjectSynchronizer::FastHashCode函数获取hash值，下图为获取对象hash值的基本流程。

FastHashCode函数

结合此流程图和代码注释读FastHashCode函数，应该很容易看懂，本文暂不详细讲解。

FastHashCode在计算hash值时，有两个核心计算hash值的函数，一个是get_next_hash()函数，一个是hash()函数.

synchronizer.cpp中的get_next_hash方法用于计算新的hash值。

static inline intptr_t get_next_hash(Thread * Self, oop obj) {
  intptr_t value = 0 ;
  if (hashCode == 0) {
     value = os::random() ;
  } else
  if (hashCode == 1) {
     intptr_t addrBits = intptr_t(obj) >> 3 ;
     value = addrBits ^ (addrBits >> 5) ^ GVars.stwRandom ;
  } else
  if (hashCode == 2) {
     value = 1 ;            // for sensitivity testing
  } else
  if (hashCode == 3) {
     value = ++GVars.hcSequence ;
  } else
  if (hashCode == 4) {
     value = intptr_t(obj) ;
  } else {
     unsigned t = Self->_hashStateX ;
     t ^= (t << 11) ;
     Self->_hashStateX = Self->_hashStateY ;
     Self->_hashStateY = Self->_hashStateZ ;
     Self->_hashStateZ = Self->_hashStateW ;
     unsigned v = Self->_hashStateW ;
     v = (v ^ (v >> 19)) ^ (t ^ (t >> 8)) ;
     Self->_hashStateW = v ;
     value = v ;
  }

  value &= markOopDesc::hash_mask;
  if (value == 0) value = 0xBAD ;
  assert (value != markOopDesc::no_hash, "invariant") ;
  TEVENT (hashCode: GENERATE) ;
  return value;
}

get_next_hash函数会根据传给JVM的参数-XX:hashCode=n来选择使用哪种方法生成对象的hashcode：

hashCode=0，hash值为系统生成的随机数
hashCode=1，hash值为对对象地址做移位和异或操作
hashCode=2，所有的hash值都等于1
hashCode=3，hash的值为一个自增序列的值
hashCode=4，hash值为此对象地址
hashCode=others, 使用Xorshift随机数生成器，Xorshift随机数生成器总体性能非常好。Xorshift原理

另外一种是hash()函数。其先获取该对象的Mark Word，然后对Mark Word对象的的地址做位移和逻辑与操作，以结果作为hash值。

intptr_t hash() const {
    return mask_bits(value() >> hash_shift, hash_mask);
}

uintptr_t value() const { 
    return (uintptr_t) this; 
}

inline intptr_t mask_bits (intptr_t  x, intptr_t m) { 
    return x & m; 
}