Pandas中使用NumPy.where修改列值方法

　　发布于2025-10-29　阅读（0）

扫一扫，手机访问

使用NumPy.where在Pandas DataFrame中根据条件转换列值

本教程详细介绍了如何在Pandas DataFrame中根据特定条件高效地转换列值，以体育赔率格式转换为例。文章重点讲解了如何利用NumPy的np.where函数，根据赔率大小（大于等于2或小于2）应用不同的数学公式，实现从小数赔率到美式赔率的精确转换，并提供了清晰的代码示例和操作步骤，帮助读者掌握数据清洗与转换的实用技巧。

引言：数据条件转换的普遍需求

在数据分析和处理中，我们经常需要根据特定条件对DataFrame中的列值进行修改。例如，在体育博彩数据分析中，赔率的表示方式多种多样，其中小数赔率（Decimal Odds）和美式赔率（American Odds）是常见的两种。当我们需要将小数赔率转换为美式赔率时，转换公式并非单一，而是取决于小数赔率本身的值：

如果小数赔率（Odds）大于或等于2，美式赔率的计算公式为：(Odds - 1) * 100。
如果小数赔率（Odds）小于2，美式赔率的计算公式为：-100 / (Odds - 1)。

这种根据条件应用不同计算逻辑的需求，在Pandas中可以通过多种方式实现，但最推荐且高效的方法是使用NumPy库中的np.where函数。

核心工具：NumPy的np.where函数

np.where函数是NumPy提供的一个非常强大的条件选择函数，它能够根据条件数组的值，从两个不同的数组中选择元素。其基本语法为：np.where(condition, x, y)。

condition：一个布尔数组，其元素为True或False。
x：当condition中对应元素为True时，选择x中的对应元素。
y：当condition中对应元素为False时，选择y中的对应元素。

np.where的优势在于其矢量化操作能力。与使用循环或apply方法相比，它在处理大型数据集时效率更高，因为它是在底层C语言级别执行的，避免了Python层的循环开销。

实战演练：小数赔率转美式赔率

假设我们有一个包含小数赔率的Pandas DataFrame，如下所示：

index	Team A	Team B	Site A	Site B	Odds A	Odds B	Profit %	Bet A	Bet B
21	Oklahoma City Thunder	Philadelphia 76ers	FanDuel	DraftKings	2.26	2.35	13.2	195.79	181.08
23	Oklahoma City Thunder	Philadelphia 76ers	FanDuel	BetMGM	2.26	2.35	13.2	195.79	181.08
25	Oklahoma City Thunder	Philadelphia 76ers	FanDuel	Caesars	2.26	2.35	13.2	195.79	181.08
27	Oklahoma City Thunder	Philadelphia 76ers	DraftKings	BetMGM	2.35	2.35	14.89	181.08	181.08

我们将使用np.where将Odds A和Odds B两列的小数赔率转换为美式赔率。

import pandas as pd
import numpy as np

# 创建示例DataFrame
data = {
    'Team A': ['Oklahoma City Thunder', 'Oklahoma City Thunder', 'Oklahoma City Thunder', 'Oklahoma City Thunder'],
    'Team B': ['Philadelphia 76ers', 'Philadelphia 76ers', 'Philadelphia 76ers', 'Philadelphia 76ers'],
    'Site A': ['FanDuel', 'FanDuel', 'FanDuel', 'DraftKings'],
    'Site B': ['DraftKings', 'BetMGM', 'Caesars', 'BetMGM'],
    'Odds A': [2.26, 2.26, 2.26, 2.35],
    'Odds B': [2.35, 2.35, 2.35, 2.35],
    'Profit %': [13.2, 13.2, 13.2, 14.89],
    'Bet A': [195.79, 195.79, 195.79, 181.08],
    'Bet B': [181.08, 181.08, 181.08, 181.08]
}
df = pd.DataFrame(data, index=[21, 23, 25, 27])

print("原始DataFrame:")
print(df)
print("-" * 30)

# 转换 'Odds A' 列
# 条件：如果 'Odds A' < 2
# True时执行：100 / (df['Odds A'] - 1)
# False时执行：100 * (df['Odds A'] - 1)
df['Odds A'] = np.where(df['Odds A'] < 2, 100 / (df['Odds A'] - 1), 100 * (df['Odds A'] - 1))

# 转换 'Odds B' 列
df['Odds B'] = np.where(df['Odds B'] < 2, 100 / (df['Odds B'] - 1), 100 * (df['Odds B'] - 1))

print("\n转换后的DataFrame (美式赔率):")
print(df)

输出结果示例（转换后的Odds A和Odds B列将显示美式赔率）：

原始DataFrame:
                      Team A              Team B    Site A      Site B  Odds A  Odds B  Profit %   Bet A   Bet B
21  Oklahoma City Thunder  Philadelphia 76ers   FanDuel  DraftKings    2.26    2.35      13.2  195.79  181.08
23  Oklahoma City Thunder  Philadelphia 76ers   FanDuel      BetMGM    2.26    2.35      13.2  195.79  181.08
25  Oklahoma City Thunder  Philadelphia 76ers   FanDuel     Caesars    2.26    2.35      13.2  195.79  181.08
27  Oklahoma City Thunder  Philadelphia 76ers  DraftKings      BetMGM    2.35    2.35      14.89  181.08  181.08
------------------------------

转换后的DataFrame (美式赔率):
                      Team A              Team B    Site A      Site B      Odds A      Odds B  Profit %   Bet A   Bet B
21  Oklahoma City Thunder  Philadelphia 76ers   FanDuel  DraftKings  126.000000  135.000000      13.2  195.79  181.08
23  Oklahoma City Thunder  Philadelphia 76ers   FanDuel      BetMGM  126.000000  135.000000      13.2  195.79  181.08
25  Oklahoma City Thunder  Philadelphia 76ers   FanDuel     Caesars  126.000000  135.000000      13.2  195.79  181.08
27  Oklahoma City Thunder  Philadelphia 76ers  DraftKings      BetMGM  135.000000  135.000000      14.89  181.08  181.08

代码详解与原理分析

在上述代码中，关键在于这两行：

df['Odds A'] = np.where(df['Odds A'] < 2, 100 / (df['Odds A'] - 1), 100 * (df['Odds A'] - 1))
df['Odds B'] = np.where(df['Odds B'] < 2, 100 / (df['Odds B'] - 1), 100 * (df['Odds B'] - 1))

df['Odds A'] < 2：这是condition部分。它会生成一个布尔Series，指示Odds A列中每个值是否小于2。
100 / (df['Odds A'] - 1)：这是x部分。当condition为True时（即小数赔率小于2），将应用此公式。
100 * (df['Odds A'] - 1)：这是y部分。当condition为False时（即小数赔率大于等于2），将应用此公式。

np.where函数对整个列（Series）进行操作，而不是逐个元素地循环。它根据布尔Series的每个对应位置，选择计算x表达式或y表达式的结果，并最终返回一个新的Series。这个新的Series随后被赋值回原始DataFrame的相应列，从而实现了列值的条件性更新。

注意事项与性能优化

矢量化操作的优势： 始终优先考虑使用np.where这类矢量化操作，而不是自定义函数与apply结合的方式（尤其是在axis=0或axis=1不明确时），因为矢量化操作通常能带来显著的性能提升，特别是在处理大规模数据时。
避免ZeroDivisionError： 在本例中，赔率通常不会为1，所以Odds - 1不会是0。但在其他需要除法的场景中，请务必检查分母是否可能为零，以避免ZeroDivisionError。可以通过添加一个额外的np.where层或预处理数据来处理这种情况。
多列处理： 如果需要对多列执行相同的条件转换逻辑，如本例中的Odds A和Odds B，可以重复应用np.where。如果列名具有规律性，也可以通过循环遍历列名列表来简化代码。
复杂条件： 对于更复杂的条件，可以使用&（与）、|（或）等逻辑运算符组合多个条件，但请记住，Pandas中的布尔Series在进行逻辑运算时需要用括号明确优先级。

总结

本教程展示了如何利用NumPy的np.where函数在Pandas DataFrame中高效地进行条件性列值转换。通过体育赔率转换的实例，我们深入理解了np.where的工作原理、语法结构及其在实际数据处理中的应用。掌握np.where是进行高效数据清洗和特征工程的关键技能之一，能够帮助数据分析师和工程师更灵活、更快速地处理各种复杂的数据转换需求。

本文转载于：互联网如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：126邮箱登录入口及安全方式

下一篇：ARCore NDK开发环境配置指南

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

饿了么app怎么绑定银行卡?饿了么app绑定银行卡方法教程

饿了么app如何绑定银行卡？亲爱的美食家们，有没有在点外卖时因为忘记钱包余额不足而懊恼？有没有因为支付不便而放弃心爱的美食？为了解决您的这些烦恼，小编特别为您准备了这个教程——饿了么app如何绑定银行卡。

13小时前 13:57 0
正版软件

微博怎么查看自己经常访问的人?微博查看频繁访问的人方法教程

微博怎么查看自己经常访问的人？微博是很多小伙伴都在使用的一款社交软件，这个软件功能强大，导致很多功能需要自己去挖掘，很多小伙伴反映想知道要怎么查看频繁访问的人，那么今天小编就来教一教大家查看方法，感兴趣的小伙伴一起来了解一下吧。

13小时前 13:14 0
正版软件

抖音怎么关闭在线状态?抖音关闭在线状态方法教程

抖音怎么关闭在线状态？我们在刷抖音短视频的时候，一些好友之间为了分享有趣的视频通常会互相关注，但互相关注了之后你的在线状态就会在好友那边显示出来，想必很多朋友都会被这个问题所困扰吧，那么怎么关闭抖音在线状态呢，接下来让小编来给大家详细介绍一下吧。

昨天 03-26 12:40 0
正版软件

纷玩岛如何预约抢票?纷玩岛预约抢票方法教程

纷玩岛如何预约抢票？纷玩岛是一款购票软件，用户可通过该app查询歌手演出情况并下单购票。为了避免错过演唱会门票的开票，用户可提前预约，软件会在开票前发送推送通知。但很多小伙伴不知道怎么预约抢票呢？今天小编将给大家带来的是纷玩岛预约抢票的方法，快来看看吧！

昨天 03-26 12:02 0
正版软件

qq怎么改防沉迷实名认证?qq防沉迷实名认证改绑方法教程

qq怎么改绑防沉迷实名认证？随着网络游戏的普及，越来越多的人会使用qq账号来登录游戏，游戏中的防沉迷实名认证系统自然就会与所登录的qq账号绑定在一起，那么想要更改防沉迷实名认证怎么办呢？下面小编就给大家带来了qq防沉迷实名认证改绑方法步骤，希望能对大家有所帮助。

昨天 03-26 11:48 0