Java Stream 去重保留首元素方法

　　发布于2026-04-20　阅读（0）

扫一扫，手机访问

如何使用 Java Stream 按指定字段去重并保留每组首个元素

本文详解如何利用 Java 8+ Stream API 实现按对象某一属性（如城市）分组后，从每组中选取首个对象构成新列表，涵盖标准写法、自定义工具方法及关键注意事项。

本文详解如何利用 Java 8+ Stream API 实现按对象某一属性（如城市）分组后，从每组中选取首个对象构成新列表，涵盖标准写法、自定义工具方法及关键注意事项。

在实际开发中，常需对集合进行“按某字段分组 + 每组取一”的操作，例如：从一批 Person 对象中，为每个 city 仅保留一人（如第一个出现的）。Java Stream 本身不提供直接的 distinctByKey 原生支持，但可通过组合 Collectors.groupingBy 与后续映射高效实现。

✅ 推荐方案：groupingBy + entrySet().stream() 提取首元素

最清晰、可读性强且符合函数式风格的做法是先按目标字段分组为 Map<K, List<V>>，再遍历 Entry 并取每组 List 的首个元素：

import java.util.*;
import java.util.stream.Collectors;

List<Person> people = Arrays.asList(
    new Person("New York", "foo", "bar"),
    new Person("New York", "bar", "foo"),
    new Person("New Jersey", "foo", "bar"),
    new Person("New Jersey", "bar", "foo")
);

List<Person> firstByCity = people.stream()
    .collect(Collectors.groupingBy(Person::getCity))
    .values().stream()
    .map(list -> list.get(0)) // 取每组第一个 Person
    .collect(Collectors.toList());

System.out.println(firstByCity);
// 输出: [{ city: New York, firstName: foo, lastName: bar }, 
//        { city: New Jersey, firstName: foo, lastName: bar }]

? 说明：Collectors.groupingBy(Person::getCity) 返回 Map<String, List<Person>>，其 values() 是所有分组列表的集合；后续流对每个 List<Person> 调用 get(0) 即得各城市的首个代表。

? 进阶封装：通用分组工具方法（支持自定义值映射）

若需复用或支持更灵活的值提取（如只取姓名、转换为 DTO），可封装泛型工具方法：

public static <E, K, V> Map<K, List<V>> groupBy(
        Collection<E> collection,
        Function<E, K> keyFn,
        Function<E, V> valueFn) {
    return collection.stream()
            .map(item -> new AbstractMap.SimpleEntry<>(
                    keyFn.apply(item), valueFn.apply(item)))
            .collect(Collectors.groupingBy(
                    Map.Entry::getKey,
                    Collectors.mapping(Map.Entry::getValue, Collectors.toList())));
}

public static <E, K> Map<K, List<E>> groupBy(
        Collection<E> collection,
        Function<E, K> keyFn) {
    return groupBy(collection, keyFn, Function.identity());
}

调用示例（等价于上例，但更具扩展性）：

List<Person> firstByCity = groupBy(people, Person::getCity)
        .values().stream()
        .map(list -> list.get(0))
        .collect(Collectors.toList());

⚠️ 注意事项与最佳实践

空安全：确保 list.get(0) 不会触发 IndexOutOfBoundsException。若源数据可能含空分组，建议改用 list.stream().findFirst().orElse(null)；
稳定性：groupingBy 默认不保证分组内顺序 —— 但因输入 List 有序且 Collectors.toList() 保持插入顺序，故 list.get(0) 确实返回首次出现的元素；
性能考量：该方案需完整遍历并构建中间 Map 和 List，时间复杂度 O(n)，空间复杂度 O(n)。对超大数据集，可考虑 TreeSet 自定义 Comparator 或第三方库（如 Eclipse Collections）优化；

替代简洁写法（无中间 Map）：使用 Collectors.toMap 配合 BinaryOperator 也能实现，但语义稍弱：

List<Person> firstByCity = new ArrayList<>(people.stream()
    .collect(Collectors.toMap(
        Person::getCity,
        Function.identity(),
        (existing, replacement) -> existing // 保留第一个
    )).values());

✅ 总结

按属性获取每组首个对象的核心在于「分组 → 提取首项」两步流水线。推荐优先采用 groupingBy + values().stream().map(...get(0)) 组合，逻辑直观、易于维护；必要时再通过泛型工具方法提升复用性。始终关注空值与顺序保障，即可稳健应对各类业务去重场景。

本文转载于：互联网如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：腾讯会议入口及官网使用教程

下一篇：悟空浏览器沉浸模式开启方法

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

同名 DTO 跨项目安全转换方法

本文介绍在Java项目中，当两个DTO类结构完全相同但位于不同包（甚至不同模块）时，如何安全、高效地实现类型转换，重点对比Jackson反序列化与MapStruct的适用场景，并提供可落地的MapStruct泛型映射解决方案。

8分钟前 0
正版软件

Python SBOM 生成工具使用详解

cyclonedx-bom是生成Python项目SBOM的最佳轻量工具，支持pipfreeze、poetry.lock等多种依赖源，需注意虚拟环境激活和显式指定配置文件，输出符合CycloneDX1.4标准，满足供应链安全与合规分析要求。

18分钟前 0
正版软件

为什么pydoc将函数‘any’识别为包？

本文探讨了使用pydoc命令查询Python内置函数any()时，可能出现的将其错误识别为包的问题。通过分析问题原因和提供解决方案，帮助读者正确使用pydoc获取函数文档，并理解不同环境下pydoc可能出现的差异。

26分钟前 0
正版软件

C++纯虚函数定义与抽象类接口规范

纯虚函数必须用=0声明且无函数体，含纯虚函数的类为抽象类不可实例化；析构函数可纯虚但须定义；接口类需虚析构、禁拷贝、无数据成员。

38分钟前 0
正版软件

PIL fromarray 处理灰度图方法

本文详解PILImage.fromarray()在处理单通道NumPy数组时的常见错误与正确用法，包括维度要求、数据类型适配、尺寸一致性及灰度图生成的最佳实践。

48分钟前 0