c++ 关联容器3 无序容器

1. 无序关联容器在存储上组织为一组桶
元素存放在多个桶中,每个桶都有一个索引,每个元素通过哈希函数计算出存放该元素的桶的索引。
例如:
ele1, ele2, ele3 … elen这个n个元素,每个元素将通过哈希函数计算出索引index:

index = hash_fun(ele);

再通过索引找到该元素对应的桶:

bucket = find_buckets(index);

再将元素放到这个桶中:

bucket.add(ele);

注意一个桶可以存放多个元素,因此不同的两个元素计算出相同的哈希值,会导致这两个元素存放在同一个桶中,因此查找一个元素时,计算出哈希值后,可能需要在桶中逐一比较每个元素和这个元素是否相等,从而查找到该元素。(当然也可以有重复的元素比如unordered_multiset,相同的元素也会存放在同一个桶中)
2. c++11 中的无序容器
c++11 中的无序容器类型默认只支持内置类型,包括std::string,指针,以及智能指针,并且有序关联容器支持的函数,无序容器基本都支持,也就是insert、at等函数同样可以使用。
若要支持自定义类型,则需要编写比较运算函数和哈希函数。
哈希函数用于计算桶的下标,比较运算函数用于在同一个桶中查找元素。
(如果元素的类型有相等运算符,则可以不额外提供一个替代相等运算符的函数)

eg:

#include 
#include 
#include 
#include 
#include 
#include 
#include 

struct Data
{
	int first;
	int second;
};

// 哈希函数 用于计算元素所属桶的索引 哈希函数决定了元素的存放方式 并且影响容器的性能
std::size_t hasher(const Data& data)
{
	return data.first % 5;
}

// 提供元素的==运算 用于在一个“桶”内查找元素
bool eqOp(const Data& ldata, const Data& rdata)
{
	return ldata.first == rdata.first;
}

int main()
{
	// Data为该容器所保存的类型
	// decltype(hasher)* 为哈希函数指针的类型
	// decltype(eqOp)* 为==函数指针的类型
	// 20为“桶”的大小 hasher为为容器提供的哈希函数 eqOp为为容器提供的==函数
	std::unordered_set<Data, decltype(hasher)*, decltype(eqOp)*> unordered_st(20, hasher, eqOp);

	Data data;
	data.first = 1;
	unordered_st.insert(data); // 该元素会插入到索引为1的桶中
	
	data.first = 2;
	unordered_st.insert(data); // 该元素会插入到索引为2的桶中

	data.first = 12;
	unordered_st.insert(data); // 该元素会插入到索引为2的桶中

	// bucket_count返回容器有多少个桶
	// bucket_size(i)返回第i个桶中有多少个元素
	for (int i = 0; i < unordered_st.bucket_count(); ++i) {
		std::cout << i << " ";
		std::cout << unordered_st.bucket_size(i) << std::endl;
	}
	// 输出结果表明 第0个桶中有0个元素 第1个桶中有1个元素 第2个桶中有2个元素 其余的桶中没有元素
}

3. 什么情况下使用无序容器

  • 当元素不支持比较时,比如没有<运算符
  • 无序容器在某些情况下性能可能更好
    因为维护元素的序的代价非常高昂,所以发现性能问题时,可尝试用无序容器解决,需要的情况下可自己编写哈希函数和比较运算符

你可能感兴趣的:(c++,primer,c++,开发语言)