您的位置:首页 >Polars 中高效截断 DataFrame 列:保留指定列及之前所有列
发布于2026-05-03 阅读(0)
扫一扫,手机访问

在 Polars 中,若需保留从首列到目标列(如 'XYZ')的所有列,丢弃其后全部列,最简洁高效的方式是使用切片语法 df[:, :'XYZ'],它语义清晰、性能优异且无需手动查找索引。
处理数据时,一个常见的需求是:只想保留从第一列到某个关键列之间的所有数据,后面的列统统不要。如果你从 Pandas 转来,可能会习惯性地去计算列索引,但在 Polars 里,其实有更优雅的解法。
Polars 原生支持直接用列名进行切片,这让列范围的截断操作变得异常直观。核心秘诀就在于这个写法:df[:, :'目标列名']。这就像对列表切片一样自然,它的意思是“从开头切到目标列(包括这一列)为止”,代码即语义,一目了然。
光说不练假把式,来看一个具体的例子:
import polars as pl
df = pl.DataFrame({
'ABC': [1, 2, 3],
'DEF': [4, 5, 6],
'XYZ': [7, 8, 9],
'GHI': [10, 11, 12],
'JKL': [13, 14, 15]
})
# ✅ 推荐:一行完成,语义明确,零额外开销
result = df[:, :'XYZ']
print(result)
运行上面的代码,你会得到如下输出:
shape: (3, 3) ┌─────┬─────┬─────┐ │ ABC ┆ DEF ┆ XYZ │ │ --- ┆ --- ┆ --- │ │ i64 ┆ i64 ┆ i64 │ ╞═════╪═════╪═════╡ │ 1 ┆ 4 ┆ 7 │ │ 2 ┆ 5 ┆ 8 │ │ 3 ┆ 6 ┆ 9 │ └─────┴─────┴─────┘
看,`‘GHI’`和`‘JKL’`列已经被干净利落地移除了,只保留了`‘XYZ’`及其之前的所有列。这种方法的优势在于,其底层实现会直接解析列名位置,省去了显式调用columns.index()这类查找索引的步骤。代码更短只是表面好处,真正关键的是它避免了潜在的重复查找开销,在处理列数众多的“宽表”时,性能优势会更加明显。
当然,有两点需要特别注意:
ColumnNotFoundError。if ‘XYZ’ in df.columns:,然后再执行切片操作。df[行, 列]中的冒号,作用于第二个维度(列维度),行维度保持不变,这符合Polars统一的索引协议。总而言之,当你需要在Polars中截断列尾时,df[:, :‘target_col’]就是那个兼具可读性、简洁性与高性能的标准答案。记住它,下次就能省下不少功夫。
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
售后无忧
立即购买>office旗舰店
正版软件
正版软件
正版软件
正版软件
正版软件
1
2
3
7
9