c++中的set容器介绍及操作

​一、核心特性​

  1. ​唯一性与自动排序​
    std::set存储的元素​​唯一且默认升序排列​​(通过std::less实现)。插入重复元素会被自动忽略:

    set s = {3, 1, 2, 2}; // 实际存储 {1, 2, 3}
    • ​底层实现​​:红黑树(自平衡二叉搜索树),保证插入、删除、查找的​​时间复杂度为O(log n)​
  2. ​元素不可修改​
    元素值即键(Key),修改会破坏红黑树结构。迭代器类型为const_iterator,禁止写操作:

    auto it = s.find(2);
    *it = 4; // 编译错误!元素不可直接修改
    • 修改的正确姿势​​:先删除旧值,再插入新值

  3. ​无随机访问​
    不支持operator[]或下标访问,遍历​​必须依赖迭代器​​(双向迭代器,仅支持++/--


️ ​​二、基本操作​

​1. 初始化与赋值​
​方式​ ​示例​
默认构造 set s;
初始化列表 set s = {1, 3, 2}; → {1, 2, 3}
迭代器范围初始化 vector v{5,4,3}; set s(v.begin(), v.end());
自定义排序规则 set> s;(降序)

4

12

​2. 增删查操作​
​操作​ ​函数​ ​示例​ ​返回值​
插入元素 insert(value) s.insert(4); pair(成功时bool=true
删除元素 erase(key) / erase(iter) s.erase(3); 或 s.erase(s.begin()); 返回被删元素后的迭代器
查找元素 find(key) auto it = s.find(2); 找到返回迭代器,否则返回s.end()
统计元素存在性 count(key) if (s.count(2)) { ... } 01(因元素唯一)

1

9

​3. 遍历方式​
// 迭代器遍历
for (auto it = s.begin(); it != s.end(); ++it) {
    cout << *it << " ";
}

// 范围循环(C++11)
for (int val : s) {
    cout << val << " ";
}

⚙️ ​​三、高级操作​

​1. 自定义排序规则​

通过函数对象或Lambda实现复杂排序:

struct CaseInsensitiveCompare {
    bool operator()(const string& a, const string& b) const {
        return tolower(a[0]) < tolower(b[0]); // 首字母不区分大小写
    }
};
set s;
​2. 范围查询(lower_bound / upper_bound)​
 
  
set s = {10, 20, 30, 40};
auto low = s.lower_bound(20); // 首个 ≥20 的元素 → 20
auto high = s.upper_bound(30); // 首个 >30 的元素 → 40
  • ​应用场景​​:快速定位有序数据中的区间
​3. 结构体存储​

需重载operator<

struct Person {
    string name;
    int age;
    bool operator<(const Person& p) const { 
        return age < p.age; // 按年龄升序
    }
};
set s = {{"Alice", 30}, {"Bob", 25}};

⚖️ ​​四、性能对比:set vs vector

​操作​ set vector ​适用场景​
​插入/删除​ O(log n)(任意位置) O(n)(非尾部操作) 频繁中间插入/删除 → ​​选set
​查找​ O(log n)(二分查找) O(n)(线性遍历) 高频查找 → ​​选set
​随机访问​ ❌ 不支持 ✅ O(1) 按索引访问 → ​​选vector
​内存占用​ 较高(树节点开销) 较低(连续内存) 内存敏感 → ​​选vector
​元素顺序​ 自动排序 插入顺序 需有序 → ​​选set

​关键结论​​:

  • ​唯一性+有序性​​需求优先选set
  • ​随机访问+连续存储​​需求优先选vector

​五、典型应用场景​

  1. ​数据去重与排序​
    从重复数据中提取唯一有序序列:

    vector data = {5, 3, 5, 2, 1};
    set unique_sorted(data.begin(), data.end()); // {1, 2, 3, 5}

  2. ​高效存在性检查​
    黑名单/白名单快速过滤:

    set blacklist = {"user1", "user2"};
    if (blacklist.find(input_user) != blacklist.end()) block_user();

  3. ​范围统计与区间查询​
    成绩分级、区间数据分析:

    set scores = {60, 75, 85, 90};
    auto pass = scores.lower_bound(60); // ≥60的第一个元素


⚠️ ​​六、避坑指南​

  1. ​迭代器失效问题​
    删除元素时,​​仅被删元素的迭代器失效​​,其他迭代器仍有效。

  2. ​无法修改元素值​
    “修改”需先删除再插入:

    auto it = s.find(old_val);
    if (it != s.end()) {
        s.erase(it);
        s.insert(new_val); // 安全修改
    }

  3. ​自定义类型必须重载operator<
    否则编译失败(红黑树需比较规则)。


​总结​

  • ​核心优势​​:自动去重、有序存储、O(log n)高效操作;
  • ​核心局限​​:无随机访问、内存开销较高;
  • ​替代方案​​:
    • 需重复元素 → multiset
    • 需O(1)查找 → unordered_set(哈希表实现,无序)。

你可能感兴趣的:(c/c++,c++,算法,开发语言)