Elasticsearch 搜索实战与 Java 开发指南

　　发布于2026-01-20　阅读（0）

扫一扫，手机访问

如何结合 Elasticsearch 与 Java 开发构建搜索应用？1. 环境搭建包括安装 Elasticsearch、配置 Java 开发环境及添加 Elasticsearch Java High Level REST Client 依赖；2. 核心概念涵盖索引、文档、映射、查询和分析器；3. 基本操作涉及连接 Elasticsearch、创建索引、索引文档、搜索文档、更新文档和删除文档；4. 高级查询支持布尔查询、范围查询、模糊查询、前缀查询、通配符查询和聚合查询；5. 性能优化需合理设计 Mapping、使用批量操作、优化查询语句、使用缓存并监控集群。选择客户端时推荐官方支持的 High Level REST Client，处理深度分页可使用 Scroll API 创建游标分批检索，数据分析则通过聚合功能实现，如按字段分组统计。

Elasticsearch 搜索与 Java 开发实战 (全网最全面教程)

Elasticsearch 与 Java 开发结合，能构建强大的搜索应用。本文旨在提供一个全面的教程，助你掌握相关技能。

解决方案

Elasticsearch 提供了 RESTful API，而 Java 则可以通过多种客户端与之交互。核心在于理解如何构建查询请求，处理响应数据，以及优化搜索性能。

1. 环境搭建：

Elasticsearch 安装： 下载并安装最新版本的 Elasticsearch。确保正确配置 elasticsearch.yml 文件，包括网络设置和 JVM 参数。
Java 开发环境： 确保安装了 JDK 1.8 或更高版本。使用 Maven 或 Gradle 管理项目依赖。

Elasticsearch Java 客户端： 在 Maven 或 Gradle 中添加 Elasticsearch Java High Level REST Client 依赖。例如，Maven 的配置如下：

<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level-client</artifactId>
    <version>7.17.6</version>
</dependency>

2. 核心概念：

索引（Index）： 类似于数据库中的表。
文档（Document）： 类似于数据库中的行，以 JSON 格式存储。
映射（Mapping）： 定义文档字段的类型和属性。
查询（Query）： 用于搜索文档的请求。
分析器（Analyzer）： 将文本分解为词条（Token）的组件，影响搜索结果。

3. 基本操作：

连接 Elasticsearch：

RestHighLevelClient client = new RestHighLevelClient(
        RestClient.builder(
                new HttpHost("localhost", 9200, "http")));

创建索引：

CreateIndexRequest request = new CreateIndexRequest("my_index");
request.mapping(
        "{\n" +
                "  \"properties\": {\n" +
                "    \"title\": {\n" +
                "      \"type\": \"text\"\n" +
                "    },\n" +
                "    \"content\": {\n" +
                "      \"type\": \"text\"\n" +
                "    }\n" +
                "  }\n" +
                "}",
        XContentType.JSON);
CreateIndexResponse createIndexResponse = client.indices().create(request, RequestOptions.DEFAULT);

索引文档：

IndexRequest request = new IndexRequest("my_index");
request.id("1");
String jsonString = "{" +
        "\"title\":\"Elasticsearch 教程\"," +
        "\"content\":\"Elasticsearch 是一个强大的搜索和分析引擎\"" +
        "}";
request.source(jsonString, XContentType.JSON);
IndexResponse indexResponse = client.index(request, RequestOptions.DEFAULT);

搜索文档：

SearchRequest searchRequest = new SearchRequest("my_index");
SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
sourceBuilder.query(QueryBuilders.matchQuery("content", "搜索"));
searchRequest.source(sourceBuilder);
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);

SearchHits hits = searchResponse.getHits();
for (SearchHit hit : hits) {
    System.out.println(hit.getSourceAsString());
}

更新文档：

UpdateRequest request = new UpdateRequest("my_index", "1");
String jsonString = "{" +
        "\"content\":\"Elasticsearch 是一个强大的分布式搜索和分析引擎\"" +
        "}";
request.doc(jsonString, XContentType.JSON);
UpdateResponse updateResponse = client.update(request, RequestOptions.DEFAULT);

删除文档：

DeleteRequest request = new DeleteRequest("my_index", "1");
DeleteResponse deleteResponse = client.delete(request, RequestOptions.DEFAULT);

4. 高级查询：

布尔查询（Boolean Query）： 组合多个查询条件。
范围查询（Range Query）： 搜索指定范围内的值。
模糊查询（Fuzzy Query）： 允许一定的拼写错误。
前缀查询（Prefix Query）： 搜索以指定前缀开头的词条。
通配符查询（Wildcard Query）： 使用通配符进行搜索。
聚合查询（Aggregation Query）： 用于统计和分析数据。

5. 性能优化：

合理设计 Mapping： 选择合适的字段类型和分析器。
使用批量操作： 减少网络请求次数。
优化查询语句： 避免使用通配符查询和模糊查询。
使用缓存： 缓存常用的查询结果。
监控 Elasticsearch 集群： 及时发现和解决性能问题。

Elasticsearch Java High Level REST Client 相比 TransportClient 更加灵活，并且在未来的版本中将会被官方推荐使用。

如何选择合适的 Elasticsearch Java 客户端？

选择 Elasticsearch Java 客户端主要考虑以下几点：官方支持、性能、易用性和社区活跃度。High Level REST Client 是官方推荐，也是未来的趋势。Transport Client 虽然稳定，但已被弃用。REST Client 则更底层，需要更多手动处理。

如何处理 Elasticsearch 的 Scroll API 来进行深度分页？

Scroll API 允许你检索大量数据，而不会受到深度分页的限制。它通过创建一个游标（Scroll ID）来记住上次检索的位置，并允许你继续检索下一批数据。

SearchRequest searchRequest = new SearchRequest("my_index");
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
searchSourceBuilder.query(QueryBuilders.matchAllQuery());
searchRequest.source(searchSourceBuilder);
searchRequest.scroll(TimeValue.timeValueMinutes(1)); // 设置 scroll 的有效时间

SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
String scrollId = searchResponse.getScrollId();
SearchHits hits = searchResponse.getHits();

while (hits.getHits().length > 0) {
    for (SearchHit hit : hits) {
        System.out.println(hit.getSourceAsString());
    }

    SearchScrollRequest scrollRequest = new SearchScrollRequest(scrollId);
    scrollRequest.scroll(TimeValue.timeValueMinutes(1));
    searchResponse = client.scroll(scrollRequest, RequestOptions.DEFAULT);
    scrollId = searchResponse.getScrollId();
    hits = searchResponse.getHits();
}

// 清除 scroll
ClearScrollRequest clearScrollRequest = new ClearScrollRequest();
clearScrollRequest.addScrollId(scrollId);
ClearScrollResponse clearScrollResponse = client.clearScroll(clearScrollRequest, RequestOptions.DEFAULT);

如何使用 Elasticsearch 的聚合功能进行数据分析？

Elasticsearch 的聚合功能非常强大，可以用于各种数据分析场景，比如统计、分组、计算平均值等等。

SearchRequest searchRequest = new SearchRequest("my_index");
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
AggregationBuilder aggregationBuilder = AggregationBuilders.terms("group_by_title").field("title.keyword"); // 使用 keyword 类型进行精确匹配
searchSourceBuilder.aggregation(aggregationBuilder);
searchRequest.source(searchSourceBuilder);

SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);

Terms terms = searchResponse.getAggregations().get("group_by_title");
List<? extends Terms.Bucket> buckets = terms.getBuckets();

for (Terms.Bucket bucket : buckets) {
    System.out.println("Title: " + bucket.getKeyAsString() + ", Count: " + bucket.getDocCount());
}

需要注意的是，对于文本类型的字段，通常需要使用 .keyword 后缀来访问其未经分析的原始值，以便进行精确匹配和聚合。

本文转载于：互联网如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：TikTok收藏夹删不掉视频怎么办

下一篇：数据库物化视图是一种预先计算并存储的查询结果，用于提高查询性能。在C#中，可以通过LINQ或SQL查询直接访问物化视图，就像操作普通表一样。

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

夸克浏览器怎么设置电脑模式?夸克浏览器设置成电脑模式教程

夸克浏览器怎么设置电脑模式？嘿，兄弟们，你是否曾经需要在手机上看网页，但又要让页面显示效果如同在电脑上的体验？如果是，那么恭喜您，夸克浏览器就是您的不二之选！它不仅拥有简洁明了的界面设计，而且夸克浏览器手机版也可以轻松设置成电脑版，让你在手机端也能够享受到如同在电脑上的浏览体验。

19小时前 12:02 0
正版软件

夸克浏览器怎么开启成人模式?夸克浏览器设置成人模式的方法

如今电子产品不仅成年人在使用，未成年也是深深着迷，而各大产品为了更好的把控未成年人的电子产品使用时间，因此很多应用都提供了未成年模式，像夸克浏览器也一样，那么夸克浏览器怎么开启成人模式呢？夸克浏览器设置成人模式的方法1、打开您的夸克浏览器应用，点击屏幕右下角的三横线菜单图标。

19小时前 11:51 0
正版软件

东方甄选如何进行企业团购?东方甄选企业团购教程

东方甄选如何进行企业团购？每次节日到来前，各位企业的小伙伴是不是还在发愁为购买公司的礼品而发愁？不妨来看看东方甄选专享的企业团购吧！东方甄选能够给企业礼物提供定制化解决方案、企业优惠、专属服务，满足多元化的需求，让企业采购简单快捷、更省心，也能让员工更放心更满意。

20小时前 11:39 0
正版软件

饿了么怎么让别人代付?饿了么让别人代付的步骤教程

饿了么怎么让别人代付？现在夏天越来越热，相信在暑假时期外卖就是大家的救命稻草，饿了么这个软件大家应该也是十分熟悉，但是很多小伙伴跟小编反馈说不知道饿了么怎么让别人代付订单，那接下来小编就来给大家解决问题，带来饿了么让别人代付的步骤，一起来往下看看吧！

昨天 03-20 13:52 0
正版软件

饿了么如何设置小额免密支付功能?饿了么设置小额免密支付教程

饿了么如何设置小额免密支付功能？随着移动支付的普及和便利性，饿了么为了进一步提升用户体验，推出了小额免密支付功能。一些小伙伴反馈第一次使用不知道怎么去开启这个免密功能，让小编出一期关于这个操作的详细教程，这不它来了！本教程将详细介绍如何设置和使用这一功能，帮助您更加便捷地享受饿了么的服务。

昨天 03-20 13:30 0

Elasticsearch 搜索实战与 Java 开发指南

产品推荐

最新发布

相关推荐

热门关注