初识 Elasticsearch

什么是 Elasticsearch？

Elasticsearch（简称 ES）是一个分布式搜索与分析引擎，基于 Apache Lucene 构建，对外提供 RESTful API。它擅长全文检索、近实时搜索和结构化数据的统计分析，常用于日志分析、站内搜索、监控指标和推荐系统等场景。

为了便于理解，可以粗略类比：

ES 没有“表结构”的强约束：文档是 JSON，不同文档可以有不同字段，字段类型由映射定义或由 ES 自动推断（动态映射）。

概念	说明
索引（Index）	类似“表”，是文档的集合，具有唯一名称（小写）。
文档（Document）	索引中的一条数据，JSON 格式，有唯一 `_id`。
映射（Mapping）	定义字段类型、是否分词、是否存储等，类似表结构。
分片（Shard）	索引在物理上被拆成多个分片，分布在不同节点，便于扩展。
副本（Replica）	每个主分片可有零个或多个副本，用于高可用与读负载分担。
集群（Cluster）	由一个或多个节点组成，共同持有全部数据。
节点（Node）	集群中的一台 ES 实例，可扮演主节点、数据节点、协调节点等角色。

后续章节会逐步展开这些概念和用法。

Elasticsearch 常与以下组件一起使用，合称 Elastic Stack（原 ELK Stack）：

组件	作用
Elasticsearch	存储、检索、聚合数据。
Kibana	可视化界面：Dev Tools 发请求、Discover 查数据、Dashboard 做图表等。
Logstash	服务端数据处理管道：采集、转换、输出到 ES 等。
Beats	轻量级采集器（如 Filebeat 收日志、Metricbeat 收指标），可直接或经 Logstash 写入 ES。

本教程以 Elasticsearch + Kibana 为主：在 Kibana 的 Dev Tools 里用 REST API 操作 ES，即可完成绝大部分学习。熟悉后可按需再学 Logstash / Beats。