python - Pandas 按唯一列值拆分数据框

标签 python pandas dataframe

<分区>

我有一个正在输出到名为“所有数据”的电子表格的数据框。假设此数据包含企业地址(街道、城市、 zip 、州的列)。但是,我还想为包含完全相同列的每个唯一状态创建一个工作表。

我的基本想法是使用 df.iterrows() 遍历每一行,然后通过将数据帧附加到新数据帧来划分数据帧,但这似乎效率极低。有更好的方法吗?

我找到了 this answer但这只是一个 bool 索引。

最佳答案

其他问题的 groupby 答案也适用于您。在您的情况下,类似于:

df_list = [d for _, d in df.groupby(['state'])]

这使用列表理解来返回数据帧列表,每个状态有一个数据帧。

关于python - Pandas 按唯一列值拆分数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62330833/

相关文章:

python - 如何在 django 2.0 的详细 View 中使用 <username>

pandas - 根据现有的列名和列值在 python 数据框中创建列

python - 在 numpy 数组的交替行和列中插入值

python - “无法导入同名游戏”

python - 匹配 Pandas 列列表中的单词并分配分数

python - 如何将 bool 条件向量应用于数据帧的每一列,例如 : Dataframe[booleanVector, :]

r - 沿着从不同年份开始且具有不同窗口长度的时间序列的移动平均值

python - Pandas DF 到 Xarray 数据集

python - 在 Python 请求模块中处理自动重定向

python - 如何使用 Tweepy 多次调用 Twitter API 以获得每个用户超过 200 条推文?