强者的自我修养免安装绿色中文版
4.29G · 2025-11-02
集合(Set)是一种 无序、可变 的数据容器, 用于存放 不重复的元素。
在 Python 中,可以通过 {} 或 set() 创建集合。
fruits = {"apple", "banana", "cherry"}
print(fruits) # {'banana', 'cherry', 'apple'}
集合中的元素是 唯一的,如果你放入重复项,Python 会自动去重。
nums = {1, 2, 2, 3, 3, 3}
print(nums) # {1, 2, 3}
{}colors = {"red", "green", "blue"}
set() 函数numbers = set([1, 2, 3, 4])
注意:创建空集合必须用 set(),
因为 {} 默认是一个空字典。
empty_set = set()
print(type(empty_set)) # <class 'set'>
s = {1, 2, 3}
s.add(4)
print(s) # {1, 2, 3, 4}
s.update([5, 6, 7])
print(s) # {1, 2, 3, 4, 5, 6, 7}
s.remove(3) # 删除指定元素,不存在时报错
s.discard(10) # 删除指定元素,不存在也不报错
s.pop() # 随机删除一个元素
s.clear() # 清空集合
集合支持多种数学意义上的集合运算,非常直观。
假设我们有以下两个集合:
A = {1, 2, 3, 4}
B = {3, 4, 5, 6}
| 运算 | 符号 | 示例 | 结果 | ||
|---|---|---|---|---|---|
| 并集 | ` | ` | `A | B` | {1, 2, 3, 4, 5, 6} |
| 交集 | & | A & B | {3, 4} | ||
| 差集 | - | A - B | {1, 2} | ||
| 对称差集 | ^ | A ^ B | {1, 2, 5, 6} |
示例代码:
print(A | B) # 并集
print(A & B) # 交集
print(A - B) # 差集
print(A ^ B) # 对称差集
集合之间可以比较包含关系:
A = {1, 2, 3}
B = {1, 2, 3, 4, 5}
print(A < B) # True,A 是 B 的子集
print(B > A) # True,B 是 A 的超集
print(A == B) # False
print(A != B) # True
Python 同样支持 集合推导式(set comprehension), 可以快速生成集合。
squares = {x**2 for x in range(1, 6)}
print(squares) # {1, 4, 9, 16, 25}
还可以加条件过滤:
even_squares = {x**2 for x in range(1, 11) if x % 2 == 0}
print(even_squares) # {4, 16, 36, 64, 100}
集合最常见的用途之一就是 去重。
numbers = [1, 2, 2, 3, 3, 4]
unique_numbers = list(set(numbers))
print(unique_numbers) # [1, 2, 3, 4]
注意:集合是无序的,因此去重后的顺序可能与原列表不同。
集合是可迭代的,可以直接用 for 遍历:
fruits = {"apple", "banana", "cherry"}
for fruit in fruits:
print(fruit)
由于集合无序,输出顺序可能每次都不一样。
在某些场景中,我们希望集合也能作为字典的键或放入另一个集合中。 这时可以使用 不可变集合(frozenset)。
A = frozenset([1, 2, 3])
B = frozenset([3, 4, 5])
print(A | B) # {1, 2, 3, 4, 5}
frozenset 支持所有集合运算,但不支持修改(add、remove 等)。
假设我们要分析两个网站的访问用户重叠情况:
site_A = {"Tom", "Lucy", "Jack", "Emma"}
site_B = {"Lucy", "Emma", "John"}
print("A站用户:", site_A)
print("B站用户:", site_B)
print("同时访问两站的用户:", site_A & site_B)
print("只访问A站的用户:", site_A - site_B)
print("所有用户:", site_A | site_B)
输出结果:
同时访问两站的用户: {'Lucy', 'Emma'}
只访问A站的用户: {'Jack', 'Tom'}
所有用户: {'Jack', 'Lucy', 'Emma', 'Tom', 'John'}
| 特点 | 说明 |
|---|---|
| 是否有序 | 无序 |
| 是否可变 | 可变(frozenset 为不可变) |
| 是否允许重复 | 不允许 |
| 创建方式 | {} 或 set() |
| 主要功能 | 去重、集合运算、关系判断 |
| 常用操作 | add()、update()、remove()、union()、intersection() 等 |
| 推导式 | 支持集合推导式 |
frozenset。