Appearance
常见问题
Java 连不上,Python 可以
Java 使用 gRPC 6334;Python 常用 6333。请确认 Docker 映射了 -p 6334:6334,且防火墙放行。
报错:vector size mismatch
写入或搜索的向量 长度 与建 Collection 时的 size 不一致。检查 Embedding 模型输出维度与 VectorParams.size。
过滤很慢或超时
对过滤用到的 payload 字段创建 索引;避免对大集合做无索引的高基数字段过滤。
换 Embedding 模型后效果变差
新向量与旧向量 不在同一空间,应 新建 Collection,全量 重新 Embedding 并灌库。
Cosine 还是 Dot
以 模型文档 为准;多数文本模型用 Cosine。不确定时用小样本对比 Recall。
能否用 Qdrant 替代 Elasticsearch
二者侧重不同:ES 强项是全文与复杂分析;Qdrant 强项是 向量近邻。RAG 常 Qdrant + ES 或仅用 Qdrant,看业务。
生产必须做什么
- 鉴权(API Key / 网络隔离)
- 备份与快照
- 监控与容量规划
- 限流 保护集群
更多
官方文档:https://qdrant.tech/documentation/
社区与 Issue:GitHub qdrant/qdrant、qdrant-client、java-client