Appearance
核心概念
Collection(集合)
一个 Collection 对应一类向量数据,类似关系库里的「一张表」,但主键是逻辑上的 点 ID,主数据是向量。
创建 Collection 时需要指定至少:
- 向量维度(
size):与 Embedding 输出一致。 - 距离类型(
distance):如 Cosine、Euclid、Dot,见「距离度量」一章。
一个 Qdrant 实例里可以有多个 Collection(例如按业务线、环境拆分)。
Point(点)
每个 Point 是库中的一条记录,包含:
| 字段 | 说明 |
|---|---|
| id | 唯一标识,整数或 UUID 字符串。 |
| vector(s) | 一个或多个命名向量(多向量场景);最常见是单个默认向量。 |
| payload | 可选 JSON 对象,存业务字段(标题、路径、权限、时间等),用于过滤和展示。 |
Vector(向量)
浮点数组,长度 = Collection 的 size。
部分场景支持多向量(一个点多个向量字段),本书以单向量为主。
Payload(载荷)
与点绑定的结构化元数据,例如:
json
{
"title": "Qdrant 入门",
"source": "docs/intro.md",
"user_id": 1001
}可对 Payload 字段建索引,以便 filter(如 user_id = 1001 且向量最近邻)。
检索在做什么
给定 query_vector 和可选 filter:
- 在(满足条件的)点中,按距离度量排序,返回 top_k 个点(含 id、score、payload 等)。
Score 的含义与距离类型有关(例如 Cosine 常表现为相似度越高分越高,具体以客户端/API 文档为准)。
小结
| 术语 | 一句话 |
|---|---|
| Collection | 同一维度、同一距离度量的向量表。 |
| Point | 一条记录 = id + 向量 + 可选 payload。 |
| Payload | 过滤与展示的 JSON 元数据。 |
接下来:如何在本机跑起 Qdrant,并打开控制台。