NaN 值在 NumPy 数组中是特殊的浮点数，表示“非数字”（Not a Number）。由于 NaN 不等于任何值，包括它自己，因此直接对包含 NaN 的数

　　发布于2026-04-13　阅读（0）

扫一扫，手机访问

如何为包含 NaN 的 NumPy 数组实现稳定哈希

本文解释为何对含 NaN 的 NumPy 数组调用 tuple() 后哈希结果不稳定，而 tobytes() 可提供确定性哈希，并给出安全、高效的自定义类哈希实现方案。

本文解释为何对含 NaN 的 NumPy 数组调用 `tuple()` 后哈希结果不稳定，而 `tobytes()` 可提供确定性哈希，并给出安全、高效的自定义类哈希实现方案。

在 Python 中为 NumPy 数组实现可靠哈希（尤其是当数组可能包含 NaN 时），关键在于理解底层数据表示与 Python 对象语义的差异。

hash1 方法（基于 tuple(self._x)）失效的根本原因在于：tuple() 会强制将 NumPy 标量（如 np.float64）逐个封装为 Python 对象。即使两个 np.float64 均为 NaN，它们对应的 Python 封装对象在每次调用 tuple() 时都是新创建的独立实例。而根据 Python 规范，float('nan') 和 numpy.float64(float('nan')) 的哈希值不保证一致——事实上，CPython 明确规定 NaN 的哈希是未定义行为（hash(float('nan')) 在不同 Python 版本或运行中可能变化），NumPy 标量亦同理。因此，hash((tuple(arr_x), tuple(arr_y))) 每次执行都可能产生不同结果，违反哈希函数的确定性（deterministic） 基本要求。

相比之下，hash2 方法（基于 tobytes()）是稳健的：

ndarray.tobytes() 直接返回底层内存缓冲区的字节拷贝（bytes 对象），完全绕过 Python 对象构造；
NaN 在 IEEE 754 双精度格式中有固定的比特模式（如 0x7ff8000000000000），只要数组 dtype 和字节序（endianness）一致，tobytes() 输出就严格相同；
bytes 类型的哈希是确定性的，且与内容一一对应。

✅ 推荐实践：使用 tobytes() 构建哈希（需注意 dtype 和顺序一致性）

def __hash__(self):
    # 确保 dtype 一致（如强制 float64），避免因 dtype 差异导致哈希不等价
    x_bytes = self._x.astype(np.float64).tobytes()
    y_bytes = self._y.astype(np.float64).tobytes()
    return hash((x_bytes, y_bytes))

⚠️ 注意事项：

若 _x/_y 可能为不同 dtype（如 float32 vs float64），需统一转换（如 astype(np.float64)），否则相同数值因字节长度不同而哈希不同；
tobytes() 依赖平台字节序；若需跨平台哈希一致性，应显式指定 order='C' 并使用 newbyteorder() 归一化（例如 .newbyteorder('<').tobytes()）；
不要依赖 __hash__ 返回值在不同 Python 进程间一致（因 hash() 默认启用随机化），如需持久化哈希，请改用 hashlib.sha256() 等加密哈希。

总结：哈希的本质是内容到整数的确定性映射。对数值型 NumPy 数组，应直接操作其二进制表示（tobytes()），而非经由易变的 Python 对象层（tuple()）。这既保障了 NaN 处理的正确性，也提升了性能——避免了数千次 Python 对象分配开销。

本文转载于：互联网如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

下一篇：Windows家长控制设置方法详解

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

Java ResourceBundle加载方法解析

ResourceBundle加载失败主因是类路径、命名或默认Locale配置错误，它不抛ClassNotFoundException而静默回退或抛MissingResourceException；实际按baseName作包路径在classpath中查找i18n/messages.properties等文件，命名需匹配locale.toString规则，且默认Locale可能被运行时覆盖，应显式指定Locale并校验关键key。

9分钟前 0
正版软件

Go 中非阻塞读取用户输入方法

在Go中，可将os.Stdin安全地作为Reader在独立goroutine中读取用户输入，从而避免阻塞主线程；关键前提是仅有一个goroutine访问标准输入流，并推荐使用更健壮的bufio.Scanner替代bufio.Reader。

24分钟前 0
正版软件

Spring Boot JWT与OAuth2认证整合指南

本文旨在指导开发者如何在SpringBoot应用中有效整合用户注册、传统凭证登录与社交媒体登录功能。针对传统JWT与OAuth2共存的场景，我们推荐采用专业的OAuth2/OpenID授权服务器来统一管理用户认证和令牌发放，从而简化SpringBoot应用作为资源服务器的安全性配置，并确保前端客户端与授权服务器的顺畅交互，提升整体系统的安全性与可维护性。

39分钟前 0
正版软件

Go语言Gin集成Swagger教程

swaginit生成的docs中无接口，因swag仅扫描带Swagger注释（如//@Summary）的具名handler函数，不解析Gin运行时路由；需确保注释紧邻函数、格式正确、docs包被下划线导入且ginSwagger.WrapHandler正确注册。

54分钟前 0
正版软件

JNI创建JVM时CLASSPATH内存问题及解决方法

本文深入探讨了在使用JNI创建Java虚拟机（JVM）时，通过-Djava.class.path配置类路径可能遇到的一个隐蔽陷阱：C/C++局部变量作用域导致的内存问题。该问题可能导致JVM无法正确加载类，尤其在不同Linux发行版上表现不一致。文章将详细解释问题根源，并提供两种健壮的解决方案，确保JVM能可靠地识别并使用指定的类路径。

1小时前 10:45 0