python - 从数组创建 Pandas 数据框

标签 python pandas loops dataframe

如何创建以数组中的每个条目命名的新数据框?

我有一个从 Pandas 数据框列创建的数组。它看起来像下面这样。

[In]  company_id = df.COMPANY_IDENTIFICATION.unique()
[In]  company_id
[OUT] array(['BBG000QFYJ26', 'BBG000C0ZQY2', 'BBG000LNZ408', ..., 'BBG000QXGV57',
   'BBG0022MJRB2', 'BBG0025394S5'], dtype=object)

我创建了一个简单的循环,但我认为它工作不正常。

for i in company_id:
    i = pd.DataFrame()

作为测试,我让它在每次迭代后打印 i。

for i in company_id:
    i = pd.DataFrame()
    print(i)

输出为:

Index: []

Empty DataFrame

Columns: []

Index: []

Empty DataFrame

Columns: []

etc.

我也无法通过我知道的数组中的名称来调用数据帧。想法?

最佳答案

更好的想法是将数据帧存储在字典中,并以名称作为键:

d= {i: pd.DataFrame() for i in company_id}

然后您可以通过字典键引用各个数据帧,例如d['BBG000QFYJ26']

您可以通过dict.items()迭代字典:

for k, v in d.items():
    # perform operation

关于python - 从数组创建 Pandas 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49675390/

相关文章:

java - 如何使用循环从 Java 中的队列中删除元素

c++ - 循环与 float 迭代

javascript - 在进入下一次迭代之前暂停循环并等待事件

python - 如何通过将新产品添加到 ManyToMany 字段来动态添加字段

python - Pandas groupby 与 lambda 并在列表中

python - grep 与 python 子进程替换

python-3.x - pandas pd.read_table 支持 io.BytesIO 和 StringIO 吗?

python - pandas Dataframe 的不同颜色取决于索引号

python - 根据另一个列表的顺序对一个列表进行排序

python - 两个序列到序列模型keras之间的区别(有和没有RepeatVector)