Java中的HashMap浅析

作者：网络转载发布时间：[ 2014/7/21 10:49:25 ] 推荐标签：软件开发 java

　　这个阈值是数组长度和加载因子的乘积，这东西有什么用呢，假设都按照默认情况来看，默认构造方法构造出来的hashmap长度为16，底层数组长度也为16，而阈值
　　threshold长度为12，因为默认加载因子是0.75。也是说当箱map中存放12个元素是，map的结构没什么变化，但是当存储第13个的时候，table需要扩容了，扩大为原来的2倍。这时候是什么结局呢，如果加载因子是1，那么map中存放16个的时候他是不会扩容的，table.length = 16，而为0.75的时候存放16个数据的时候table.length = 32。那么同样是存放16个数据，分别在长度为16的数组和32的数组中存放，出现冲突的几率一般来说16的数组要大一些，那为什么会大一些呢，因为某个数据存放进入数组的位置是根据
　　int hash = hash(key.hashCode());
　　int i = indexFor(hash， table.length);
　　这两个方法算出来的，其中包括table.length，换句话说，位置i跟hash和table.length是相关的，也是说位置i与table.length是联动的，换个角度，存放的16个数据假设是固定的，而得出hashCode的算法也是固定的，那么位置i只跟length的大小有关联了，一般来说length越大，数据的冲突几率低一些，在map.getValue(key)的时候需要在链表中比较的次数少一些，性能高一些。这是Java中hashmap的性能因素，一般来说加载因子factor大，同样个数的数据所占用空间越小，table.length越小，冲突几率越大，反之空间利用率低，性能高，类比一下，比如你地上放了10个碗，你手里面握了10颗大米，你撒下去，前提是必须10颗米都要撒进碗里，你是不是会发现有些碗里面装了两颗三颗，而有些碗是空的，接下来，你在地上摆20个碗，还是撒10颗米下去，依然是所有的米都要进碗，依然还是会出现有些晚是空的，有些是一颗两颗三颗这种现象，但是很明显一般来讲20个碗的时候每个碗里面装不止一颗的情况要比10个碗的情况要少，当然也不一定完全是这样，但是一般来说是这样，这是hash算法，如果设计的好的情况下我们希望每个碗里面都多放一颗进去，但是这种情况比较少见，但不管怎么说，按照普遍情况来看，20个碗的装多颗的情况是比10个碗装多颗的情况要少一点。从数据结构的角度来说叫做用空间换时间的策略，以空间换时间何止hash算法，双向链表也是用空间换时间的策略。至于说为什么默认是0.75，我估计这个是前辈们和科学家们总结出来的一个这种的办法，空间利用率比较不错的同时性能比较令人接受吧。
　　顺便说一下啊，当我们不断的往一个hashmap里面添加数据的时候，如果超过某个阈值，他会扩容，扩容的同时会让之前的所有元素重新生成地址，并且把原来的数组里面的数据迁移到新的数组中(新的数组容量是原来的两倍长度)。顺便说下，这个数据迁移其实对性能损耗还是相当大的，毕竟你是要复制数组，同时要重新构建每个元素的在table中的位置，因此我们可以在使用hashMap之前大概的估算一下这个hashMap里面大概会存多少个元素，这样可以在new hashmap的时候给定他的容量，这样数据迁移的次数相对少一些，性能更好一点。
　　接下来从JDK的源码来看看HashMap。
　　1.构造出一个空的HashMap。默认长度16，底层Entry数组也是16的默认长度。默认加载因子default_factor为0.75。阈值16*0.75=12。key和value都存在与Entry这个类型里面。
　　public HashMap() {
　　this.loadFactor = DEFAULT_LOAD_FACTOR;
　　threshold = (int)(DEFAULT_INITIAL_CAPACITY * DEFAULT_LOAD_FACTOR);
　　table = new Entry[DEFAULT_INITIAL_CAPACITY];
　　init();
　　}
　　2.调用put方法。

public V put(K key， V value) {
if (key == null)
return putForNullKey(value);
int hash = hash(key.hashCode());
int i = indexFor(hash， table.length);
for (Entry<K，V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}

　　首先是判断key是否为空，如果为空，那么调用下面这个方法，这个方法说明，HashMap的null的key始终是存放在table的table[0]位置的，不管table[0]位置有没有冲突都是这样。

private V putForNullKey(V value) {
for (Entry<K，V> e = table[0]; e != null; e = e.next) {
if (e.key == null) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
addEntry(0， null， value， 0);
return null;
}

　　如果不为空，那么继续，这里，如果算出来的位置i出已经有元素了，说明冲突了，那么遍历冲突链表，如果发现key相等，那么直接用新的value替换掉的value并且返回旧的value。这里只判断相等的情况而不判断不相等的情况，也是这里不做添加操作。

int hash = hash(key.hashCode());
int i = indexFor(hash， table.length);
for (Entry<K，V> e = table[i]; e != null; e = e.next) {
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}

本文内容不用于商业目的，如涉及知识产权问题，请权利人联系SPASVO小编(021-61079698-8054)，我们将立即处理，马上删除。