Appearance
认识 Qdrant
Qdrant 是什么
Qdrant 是一款开源的向量搜索引擎(也常称为向量数据库)。它专门用来存储高维向量,并支持相似度检索:给定一个查询向量,快速找出库中与它「最像」的一批向量。
典型场景包括:
| 场景 | 说明 |
|---|---|
| RAG(检索增强生成) | 把文档切成块,向量化后存入 Qdrant;用户提问时先检索相关片段,再交给大模型回答。 |
| 以图搜图 / 以文搜图 | 图像或文本经模型变成向量,按相似度找相似内容。 |
| 推荐与去重 | 用户/商品向量近邻搜索、相似内容聚类。 |
Qdrant 用 Rust 实现,强调性能与资源控制,同时提供 REST API、gRPC、Web 控制台 以及 Python、Java 等官方客户端。
和关系型数据库的区别
- MySQL 等:按主键、精确条件、范围查询;适合结构化业务数据。
- Qdrant:核心是「这个向量附近有哪些点」;适合语义相似而非字符串完全相等。
二者常配合使用:业务元数据、订单、用户表在关系库;语义检索在 Qdrant,通过 Payload(见后文)里的 user_id、doc_id 等与业务表关联。
你会在本书里学到什么
- 概念:Collection、Point、Vector、Payload、距离度量。
- 动手:Docker 启动、控制台浏览、用 Python / Java 完成建库、写入、搜索。
- 进阶:过滤、批量、量化、分片、简易 RAG 思路。
下一节我们从「向量从哪来」讲起:Embedding。