Appearance
点与向量
Point 结构
每个点包含:
id
- 整数 unsigned 或 UUID 字符串。
- 同一 Collection 内唯一。
vector
- 长度为 Collection
size的float数组。 - 多向量模式下为「名字 → 向量」映射。
- 长度为 Collection
payload(可选)
- JSON 对象,字符串、数字、布尔、数组等,用于过滤与展示。
ID 选型
| 类型 | 适用 |
|---|---|
| 自增整数 | 简单、性能好;需自己维护与业务主键映射表。 |
| UUID | 分布式生成方便;可读性差。 |
常见做法:业务主键哈希或单独映射表,点 id 与 payload.doc_id 同时存在,便于对账。
向量精度
一般为 float32。写入时维度多了一个或少了一个会报错;数值过大过小可能影响数值稳定性,按模型输出原样写入即可。
Upsert 语义
Upsert = 若 id 已存在则覆盖该点(向量与 payload 按请求更新),不存在则插入。适合同步任务重复执行。
下一节:Payload 与如何为字段建索引以支持过滤。