Skip to content

核心概念

Collection(集合)

一个 Collection 对应一类向量数据,类似关系库里的「一张表」,但主键是逻辑上的 点 ID,主数据是向量

创建 Collection 时需要指定至少:

  • 向量维度size):与 Embedding 输出一致。
  • 距离类型distance):如 CosineEuclidDot,见「距离度量」一章。

一个 Qdrant 实例里可以有多个 Collection(例如按业务线、环境拆分)。

Point(点)

每个 Point 是库中的一条记录,包含:

字段说明
id唯一标识,整数或 UUID 字符串。
vector(s)一个或多个命名向量(多向量场景);最常见是单个默认向量
payload可选 JSON 对象,存业务字段(标题、路径、权限、时间等),用于过滤展示

Vector(向量)

浮点数组,长度 = Collection 的 size
部分场景支持多向量(一个点多个向量字段),本书以单向量为主。

Payload(载荷)

与点绑定的结构化元数据,例如:

json
{
  "title": "Qdrant 入门",
  "source": "docs/intro.md",
  "user_id": 1001
}

可对 Payload 字段建索引,以便 filter(如 user_id = 1001 且向量最近邻)。

检索在做什么

给定 query_vector 和可选 filter

  • 在(满足条件的)点中,按距离度量排序,返回 top_k 个点(含 id、score、payload 等)。

Score 的含义与距离类型有关(例如 Cosine 常表现为相似度越高分越高,具体以客户端/API 文档为准)。

小结

术语一句话
Collection同一维度、同一距离度量的向量表。
Point一条记录 = id + 向量 + 可选 payload。
Payload过滤与展示的 JSON 元数据。

接下来:如何在本机跑起 Qdrant,并打开控制台。