商城首页欢迎来到中国正版软件门户

您的位置:首页 >C#怎么使用LINQ Distinct去重 C#如何用LINQ对集合按指定字段去重和自定义比较器【语法】

C#怎么使用LINQ Distinct去重 C#如何用LINQ对集合按指定字段去重和自定义比较器【语法】

  发布于2026-05-03 阅读(0)

扫一扫,手机访问

C#怎么使用LINQ Distinct去重 C#如何用LINQ对集合按指定字段去重和自定义比较器【语法】

C#怎么使用LINQ Distinct去重 C#如何用LINQ对集合按指定字段去重和自定义比较器【语法】

Distinct 默认去重只适用于值类型或重写了 Equals/GetHashCode 的引用类型

直接对 List 这类引用类型调用 .Distinct(),结果往往不是你想要的——它默认比较的是对象引用,不是字段内容。哪怕两个 Person 对象的 NameAge 完全一样,也会被当成不同元素保留下来。

常见错误现象:.Distinct() 没生效,集合长度不变,或者调试时发现“明明一样却没去重”。

  • 值类型(如 intstring)可直接用 .Distinct()
  • 自定义类必须显式提供比较逻辑,否则默认行为不可靠
  • 字符串是引用类型但已重写 Equals,所以 List.Distinct() 是安全的
Distinct默认对引用类型按对象引用去重,需自定义比较逻辑;值类型和已重写Equals的引用类型(如string)可直接使用;按单字段用GroupBy+First,多字段用匿名类型+DistinctBy(.NET 6+)或GroupBy,复杂场景需实现IEqualityComparer

按单个字段去重:用 GroupBy + First 最直观

不需要写比较器,也不用额外定义类,适合快速按 IdName 等唯一字段筛选“第一个出现的记录”。

示例:从 list 中取每个 CategoryId 第一次出现的 Product

var uniqueByCategory = list
    .GroupBy(x => x.CategoryId)
    .Select(g => g.First())
    .ToList();
  • GroupBy 分组后每组至少有一个元素,First() 取首个,语义清晰
  • 性能上比 Distinct + 自定义比较器略低(需遍历并分组),但开发效率高、不易出错
  • 如果想取“最新”的(比如按 CreatedTime 最大的),把 First() 换成 OrderByDescending(x => x.CreatedTime).First()

按多个字段去重:用匿名类型 + Distinct 最简洁

当需要同时基于 FirstNameLastName 去重时,匿名类型会自动实现结构相等比较,无需手写比较器。

示例:去除姓名重复的用户

var uniqueByName = users
    .DistinctBy(u => new { u.FirstName, u.LastName })
    .ToList();

⚠️ 注意:DistinctBy 是 .NET 6+ 新增的扩展方法(在 System.Linq 中),旧版本需用 GroupBy 替代:

var uniqueByName = users
    .GroupBy(u => new { u.FirstName, u.LastName })
    .Select(g => g.First())
    .ToList();
  • 匿名类型字段名和大小写必须一致,new { F = u.FirstName }new { FirstName = u.FirstName } 不等价
  • 字段值为 null 时也能正确比较(匿名类型对 null 有安全处理)
  • 不支持动态字段数(比如“运行时传入字段名列表”),这种场景必须用自定义 IEqualityComparer

自定义比较器:IEqualityComparer 是唯一可控方案

当需要复杂逻辑(如忽略大小写、按子字符串匹配、多级优先级判断)或兼容旧框架(.NET Framework / .NET 5-)时,必须实现 IEqualityComparer

示例:按 Code 字段忽略大小写去重

public class CodeComparer : IEqualityComparer
{
    public bool Equals(Product x, Product y) =>
        x?.Code?.Equals(y?.Code, StringComparison.OrdinalIgnoreCase) == true;

    public int GetHashCode(Product obj) =>
        obj?.Code?.ToLowerInvariant().GetHashCode() ?? 0;
}

使用:

var unique = products.Distinct(new CodeComparer()).ToList();
  • GetHashCode 必须与 Equals 逻辑一致,否则 Distinct 可能漏判或误判
  • 空值(null)必须显式处理,否则 NullReferenceException 很容易发生
  • 比较器实例可复用,不要每次调用都 new 一个——尤其在循环或高频路径中

最常被忽略的一点:Distinct 的执行是延迟的,但去重逻辑依赖于你提供的比较方式是否真正覆盖所有业务场景。比如按 Email 去重,却没考虑前后空格或大小写,数据就悄悄重复了。

本文转载于:https://www.php.cn/faq/2316981.html 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注