ArrayList、HashMap、HashSet源码总结
最后更新于:2022-04-01 12:01:47
## ArrayList:
1. ArrayList是List接口的大小可变数组的实现,此实现是不同步的。
2. ArrayList内部使用类型为Object[]的数组存储元素。
3. ArrayList默认的数组长度为10, 当需要扩大容量时,扩大后的容量为:newCapacity = (oldCapacity * 3)/2 + 1;
4. ArrayList的clone方法为浅拷贝(shallow copy)
5. ArrayList的remove方法根据参数类型的不同有两种重载:
remove(int index) : 删除指定位置的元素;
remove(Object o) : 删除第一个遇到的元素,如果没有不做改变
6. ArrayList允许null值、允许重复值、不排序,获取快速,增删麻烦。
## HashMap:
HashMap是不同步的。
HashMap内部使用类型为Entry[]的数组存储元素。Entry是HashMap的一个内部类,定义如下所示。
每一个Entry对象其实是一个单向链表,之后的解析可以看到,最后存入的元素在最前面。
备注:下面出现的代码都是HashMap.java中的源码,中文描述是作者加的。
~~~
transient Entry[] table;//HashMap内部定义的数据存储变量
//内部类
static class Entry<K,V> implements Map.Entry<K,V> {
final K key;
V value;
Entry<K,V> next;
final int hash;
/**
* Creates new entry.
*/
Entry(int h, K k, V v, Entry<K,V> n) {
value = v;
next = n;
key = k;
hash = h;
}
*****
省略
*****
}
~~~
### HashMap中几个概念:
capacity:容量,即Entry[]数组的长度
loadFactor:负载因子,Entry[]数组中实际数据量/容量的比例达到loadFactor时,HashMap就需要扩大容量了,一般扩大为原来的两倍。
threshold: 当HashMap中的元素个数超过这个数值时,就将扩大容量。
### put方法:
~~~
public V put(K key, V value) {
if (key == null)
//如果key为null,特殊处理,key为null直接存储在table[0]位置。
return putForNullKey(value);
int hash = hash(key.hashCode());
int i = indexFor(hash, table.length);//此处得到的i即为key对应的HashMap中的存储位置table[i]
for (Entry<K,V> e = table[i]; e != null; e = e.next) {
//从Entry链表的第一个开始如果找到与key执行equals方法为true的Entry,则修改对应Entry的value值为新值,key不做修改
Object k;
if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
V oldValue = e.value;
e.value = value;
e.recordAccess(this);
return oldValue;
}
}
modCount++;
//如果没有找到对应的key,则执行增加操作
addEntry(hash, key, value, i);
return null;
}
void addEntry(int hash, K key, V value, int bucketIndex) {
Entry<K,V> e = table[bucketIndex];
table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
if (size++ >= threshold)
//如果大小超过了threshold,扩大容量为原来的两倍。扩大容量时,所有的key-value需要重新hash。
resize(2 * table.length);
}
void resize(int newCapacity) {
Entry[] oldTable = table;
int oldCapacity = oldTable.length;
if (oldCapacity == MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return;
}
Entry[] newTable = new Entry[newCapacity];
transfer(newTable);//将原来hash表中的数据放入新的hash表中,需要重新hash。
table = newTable;
threshold = (int)(newCapacity * loadFactor);
}
/**
* Transfers all entries from current table to newTable.
*/
void transfer(Entry[] newTable) {
Entry[] src = table;
int newCapacity = newTable.length;
for (int j = 0; j < src.length; j++) {
Entry<K,V> e = src[j];
if (e != null) {
src[j] = null;
//此处使用循环,将原来hash链中的所有的key-value都重新获取hash值,重新放置。
//因为放置位置是跟hash表的大小有关的,当hash表容量扩大后,之前放在一个地方的key-value对现在可能hash不到同一个地方了。
do {
Entry<K,V> next = e.next;//记录此处的下一个地址
int i = indexFor(e.hash, newCapacity);//重新计算当前的key-value在新hash表中的位置
e.next = newTable[i];//将之前在同一位置的数据放在e的next位置,没有则为null
newTable[i] = e;//将e作为hash表i位置的第一个元素
e = next;//将next赋值给e, 对原来j位置的所有的元素都执行重新hash,重新放置
} while (e != null);
}
}
}
~~~
get方法:按照put时的逻辑根据key获取value。不再详述。
### keySet与values方法:
这两个方法作用好理解,但需要注意的是,当对keySet()和values()方法获取到的集合执行remove操作的时候就相当于对HashMap集合本身执行remove操作。看源码通过keySet和values获取到的好像是HashMap的迭代器,这里我没有深究。如果谁明白具体原因不吝赐教。
# HashSet:
HashSet的内部是用的HashMap实现的,使用Entry将每一个HashSet元素的引用存储在key位置,value位置使用默认的数据填充。
在此也可以看到,HashMap中的key-value对其实可以看成value是每一个key的附属,只需要找到每一个key的位置,然后把对应的value放入即可。