商城首页欢迎来到中国正版软件门户

您的位置:首页 >Python列表转Pandas DataFrame教程

Python列表转Pandas DataFrame教程

  发布于2026-01-10 阅读(0)

扫一扫,手机访问

将Python对象列表转换为Pandas DataFrame的实用指南

本文介绍了如何将Python对象列表高效地转换为Pandas DataFrame,重点讲解了利用vars()函数以及处理dataclasses和__slots__类的方法。通过示例代码和详细解释,帮助读者掌握自动化转换技巧,避免手动指定列名,提升数据处理效率。

在数据分析和处理中,经常需要将自定义的Python对象列表转换为Pandas DataFrame,以便进行后续的分析和操作。本文将介绍几种常用的方法,帮助你高效地完成这一转换过程,并避免手动指定列名。

使用 vars() 函数

对于简单的类,例如具有属性 name 和 age 的 Person 类,可以使用内置的 vars() 函数将对象转换为字典,然后使用 Pandas DataFrame 构造函数创建 DataFrame。

import pandas as pd

class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age

person_list = [Person("Mary", 30), Person("John", 32)]

df = pd.DataFrame([vars(p) for p in person_list])
print(df)

输出:

   name  age
0  Mary   30
1  John   32

vars(p) 返回一个包含对象 p 的属性名称和值的字典。通过列表推导式,将 person_list 中的每个 Person 对象转换为字典,然后传递给 pd.DataFrame(),即可创建一个 DataFrame。

处理 dataclasses

如果你的类是使用 dataclasses 模块定义的,特别是嵌套的 dataclasses 或使用了 slots,可以使用 .asdict() 方法将对象转换为字典。

from dataclasses import dataclass, asdict
import pandas as pd

@dataclass
class Person:
    name: str
    age: int

person_list = [Person("Mary", 30), Person("John", 32)]

df = pd.DataFrame([asdict(p) for p in person_list])
print(df)

输出:

   name  age
0  Mary   30
1  John   32

.asdict() 方法可以递归地将 dataclass 对象转换为字典,方便创建 DataFrame。

处理带有 __slots__ 的类

如果你的类使用了 __slots__,vars() 方法可能无法正常工作。在这种情况下,可以使用以下方法:

import pandas as pd

class Person:
    __slots__ = ('name', 'age')
    def __init__(self, name, age):
        self.name = name
        self.age = age

person_list = [Person("Mary", 30), Person("John", 32)]

df = pd.DataFrame([{a: getattr(p, a) for a in p.__slots__} for p in person_list])
print(df)

输出:

   name  age
0  Mary   30
1  John   32

这个方法通过遍历 p.__slots__ 获取属性名称,然后使用 getattr(p, a) 获取属性值,构建字典,最后创建 DataFrame。

注意事项:

  • __slots__ 用于限制类实例可以拥有的属性,可以节省内存,但会影响某些动态特性。
  • 在处理复杂的类结构时,可能需要自定义转换函数,以确保数据正确地转换为 DataFrame。

总结:

本文介绍了三种将Python对象列表转换为Pandas DataFrame 的方法,分别适用于不同的类结构。vars() 函数适用于简单的类,.asdict() 方法适用于 dataclasses,而对于带有 __slots__ 的类,则需要使用 getattr() 方法。选择合适的方法可以高效地完成转换,并避免手动指定列名,提高数据处理效率。

本文转载于:互联网 如有侵犯,请联系zhengruancom@outlook.com删除。
免责声明:正软商城发布此文仅为传递信息,不代表正软商城认同其观点或证实其描述。

热门关注