Skip to content

点与向量

Point 结构

每个点包含:

  1. id

    • 整数 unsignedUUID 字符串
    • 同一 Collection 内唯一。
  2. vector

    • 长度为 Collection sizefloat 数组。
    • 多向量模式下为「名字 → 向量」映射。
  3. payload(可选)

    • JSON 对象,字符串、数字、布尔、数组等,用于过滤与展示。

ID 选型

类型适用
自增整数简单、性能好;需自己维护与业务主键映射表。
UUID分布式生成方便;可读性差。

常见做法:业务主键哈希或单独映射表,点 idpayload.doc_id 同时存在,便于对账。

向量精度

一般为 float32。写入时维度多了一个或少了一个会报错;数值过大过小可能影响数值稳定性,按模型输出原样写入即可。

Upsert 语义

Upsert = 若 id 已存在则覆盖该点(向量与 payload 按请求更新),不存在则插入。适合同步任务重复执行。

下一节:Payload 与如何为字段建索引以支持过滤。