python - For Loop 使用 Pandas 创建包含分支数据的数据集

标签 python pandas for-loop

我想创建一个具有此结构的数据集 enter image description here

这就像创建一个层次结构数据集。最终数据集将包含 100 x 2 x 3 x 25 = 15,000 行数据。我正在将 Python 与 Pandas 一起使用 (变量 1 号有 100 个值。在变量 1 号的每个值中,将有来自变量号 2 的 2 个变量。在变量号 2 的每个值中,将有来自变量号 3 的 3 个变量。 3,依此类推)

我尝试使用 ForLoop 来处理 4 号变量,但我不知道如何使更高级别的变量交替填充数据集。

variable4= range(0,25)

for i in range (0,25):
    dataset.iloc[i,4] = variable4[i]
    dataset.iloc[i,3] = 'Var3value'

请给我一些关于如何制作此类结构的建议。

P/s:欢迎使用并行计算来加快计算时间!

最佳答案

您可以使用MultiIndex.from_product然后调用DataFrame构造函数:

a = range(100)
b = list('ab')
c = list('ABC')
d = list(range(100, 125))

mux = pd.MultiIndex.from_product([a,b,c,d], names=list('xyuz'))

df = pd.DataFrame({'col':range(15000)}, index=mux)
print (df)
              col
x  y u z         
0  a A 100      0
       101      1
       102      2
       103      3
       104      4
       105      5
       106      6
...
...

关于python - For Loop 使用 Pandas 创建包含分支数据的数据集,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46316113/

相关文章:

python - 将非常大的 n 基数转换为字节

pandas - 通过排除某些词汇更快地加载 fasttext 模型

python - 查找索引行和数据框中每一行之间的公共(public)非空列

python - 对象 `astype(float)` 的 DataFrame 行为因列表或数组而异

python - 在 for 循环字符串中切换单词

python - 通过 Python 版本制作 `nosetests` 脚本选择文件夹

python - 将 [28,28,2] matlab 数组转换为 [2, 28, 28, 1] 张量

c# - 通过 for 循环迭代文本框

c# - 快速提问 : C# Linq "Single" statement vs "for" loop

python - impyla (0.14.0) 错误 - 'TSocket' 对象没有属性 'isOpen'