Skip to content

常见问题

Java 连不上,Python 可以

Java 使用 gRPC 6334;Python 常用 6333。请确认 Docker 映射了 -p 6334:6334,且防火墙放行。

报错:vector size mismatch

写入或搜索的向量 长度 与建 Collection 时的 size 不一致。检查 Embedding 模型输出维度与 VectorParams.size

过滤很慢或超时

对过滤用到的 payload 字段创建 索引;避免对大集合做无索引的高基数字段过滤。

换 Embedding 模型后效果变差

新向量与旧向量 不在同一空间,应 新建 Collection,全量 重新 Embedding 并灌库

Cosine 还是 Dot

模型文档 为准;多数文本模型用 Cosine。不确定时用小样本对比 Recall

能否用 Qdrant 替代 Elasticsearch

二者侧重不同:ES 强项是全文与复杂分析;Qdrant 强项是 向量近邻。RAG 常 Qdrant + ES 或仅用 Qdrant,看业务。

生产必须做什么

  • 鉴权(API Key / 网络隔离)
  • 备份与快照
  • 监控与容量规划
  • 限流 保护集群

更多

官方文档:https://qdrant.tech/documentation/
社区与 Issue:GitHub qdrant/qdrantqdrant-clientjava-client