如何还原PDP模型坐标轴原始尺度

　　发布于2026-04-19　阅读（0）

扫一扫，手机访问

如何在使用标准化数据训练模型后，为部分依赖图（PDP）正确还原原始尺度的坐标轴

当使用 StandardScaler 对特征进行标准化后训练模型并绘制部分依赖图时，x轴显示的是缩放后的数值，影响业务可解释性；本文介绍如何通过反向变换刻度标签，将PDP横轴恢复为原始数据单位，无需重拟合模型或修改内部计算逻辑。

当使用 `StandardScaler` 对特征进行标准化后训练模型并绘制部分依赖图时，x轴显示的是缩放后的数值，影响业务可解释性；本文介绍如何通过反向变换刻度标签，将PDP横轴恢复为原始数据单位，无需重拟合模型或修改内部计算逻辑。

在基于标准化数据（如 StandardScaler）训练随机森林等模型后，直接调用 PartialDependenceDisplay.from_estimator() 生成的部分依赖图（PDP）会以缩放后的特征值为横坐标，导致图表难以被领域人员理解（例如显示 -1.2 到 2.4 而非原始的 35.6℃ 或 8200元）。关键在于：PDP 的计算本身依赖于模型对输入的预测行为，而模型只“认识”标准化后的数据；因此不能简单地对 X_test_final 反标准化后再传入绘图函数——这会导致预测失效。正确做法是保留模型输入的标准化流程，仅对可视化端的坐标轴刻度标签进行逆变换。

具体实现分三步：

先绘制原始 PDP 并获取坐标轴对象：

import matplotlib.pyplot as plt
from sklearn.inspection import PartialDependenceDisplay

# 绘制 PDP（仍使用标准化的 X_test_final）
fig, ax = plt.subplots(figsize=(8, 6))
display = PartialDependenceDisplay.from_estimator(
    best_clf, X_test_final, best_features, ax=ax
)

对 x 轴刻度执行逆标准化（反 StandardScaler）：
假设你已保存了用于训练的 StandardScaler 实例（推荐做法），或能从原始训练特征 X_train 中重新计算均值与标准差：

# ✅ 推荐：使用训练时保存的 scaler（确保一致性）
# scaler = StandardScaler().fit(X_train)
# mean_val = scaler.mean_[feature_idx]  # 某一特征的均值
# std_val = scaler.scale_[feature_idx]   # 对应标准差

# 若未保存 scaler，且 X_train 是原始训练集（二维数组），可按特征索引提取：
feature_idx = 0  # 替换为你要可视化的特征在 X_train 中的列索引
mean_val = X_train[:, feature_idx].mean()
std_val = X_train[:, feature_idx].std()

# 获取当前 x 轴刻度位置（标准化尺度）
x_ticks = ax.get_xticks()

# 逆变换：X_original = X_scaled × std + mean
xticks_unscaled = [(xt * std_val) + mean_val for xt in x_ticks]

# 格式化为易读字符串（如保留1位小数，或根据数据类型调整）
ax.set_xticklabels([f'{val:.1f}' for val in xticks_unscaled])

完善图表并展示：

ax.set_xlabel(f'{feature_name} (original scale)')  # 添加单位说明
plt.tight_layout()
plt.show()

⚠️ 注意事项：

刻度逆变换仅影响标签显示，不改变 PDP 曲线形状或计算逻辑，完全安全；
务必使用训练集而非测试集计算 mean 和 std，以符合 StandardScaler 的设计原则；
若 best_features 包含多个特征，需对每个子图分别处理其对应特征的 mean_val/std_val；
对于类别型特征或经过其他预处理（如 One-Hot 编码）的特征，此方法不适用，需单独处理。

通过该方法，你既能复用高效、稳定的标准化建模流程，又能输出面向业务解读的、具备真实物理/业务意义的部分依赖图，真正实现“建模与解释”的解耦与兼顾。

本文转载于：互联网如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：信息系统开发新方法有哪些

下一篇：循环中如何用前后非零值填充零值

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

Python怎么将多个列表转为字典_利用zip函数构建映射关系

Python怎么将多个列表转为字典_利用zip函数构建映射关系 zip函数怎么把两个列表变成字典这事儿其实很简单，核心就一行代码：dict(zip(keys, values))。当然，前提是两个列表长度得一致，而且keys里的元素必须是可哈希的，比如字符串、数字或者元组。这可以说是最经典、也最稳妥

2分钟前 0
正版软件

Laravel怎样在Observer观察者中触发事务_Laravel模型观察者事务集成方法【事件】

Lara vel Observer 中数据库操作事务失效需手动处理：一、将 Observer 逻辑移入 DB::transaction 闭包；二、Observer 内手动启停事务（慎用）；三、改用事件监听器并绑定事务；四、用 SA VEPOINT 实现局部回滚。在 Lara vel 项目里，你是否

3分钟前 0
正版软件

Crontab运行Go二进制程序的正确方法

Crontab默认环境缺失PATH、GOPATH及工作目录上下文，导致Go编译程序静默失败；需显式配置环境变量、使用绝对路径、重定向日志并确保二进制兼容性。

4分钟前 0
正版软件

c#如何实现分布式事务_c#分布式事务最全用法总结

C# 中无法原生实现分布式事务，System.Transactions 仅包装 Windows 的 MSDTC，受限于平台与网络配置；跨平台场景应采用 Saga 模式等应用层一致性方案。分布式事务在 C# 中根本不能“原生实现” 先澄清一个常见的误解：C# 语言本身并不提供分布式事务的底层实现。我

4分钟前 0
正版软件

如何基于另一数据框时间戳中心对 Pandas 数据框进行时间窗口滚动均值计算

本文介绍如何将高频数据框（如每15秒采样）中以低频参考时间点（如每5分钟）为中心、按真实时间窗口（如±2.5分钟）计算滚动均值，并精准对齐到参考时间点。核心使用 rolling(..., on='time', center=True) 与 merge_asof 协同实现。在时序数据分析中，我们常常

7分钟前 0

如何还原PDP模型坐标轴原始尺度

产品推荐

最新发布

相关推荐

热门关注