dataframe - 获取 Julia 数据框中一行的索引(类似于 iterrows？)

标签 dataframe indexing iteration julia

在 Julia 中遍历 df 时，有没有办法获取行的索引和行对象？如果没有，即使找到行索引的方法也会很棒，因为我可以简单地使用 eachrow() 然后找到迭代行的索引，尽管我认为考虑到命名这不太可能Julia 并不真正支持 df 的索引。

对于上下文，我需要索引以便在 df 的每一列中找到第一次出现的 0，以便我可以将其替换为另一个值(例如 99)。为此，我想遍历 df 中每一列的所有行。例如对于 df = DataFrame(a = [1, 0, 2], b = [0, 1, 0], c = [0, 0, 4]) 代码:

for col_index in ["a", "b", "c"]
    for row in eachrow(select(df, :i))
        if row[1] == 0
            df[row.index, :i] = 99
            break
        end
    end
end

会把 df 变成

1 99 99
99 1 0 
2 0 4

很抱歉，如果这是一个愚蠢的问题，尽管我无法在网上找到任何与我的目标相关的信息。

最佳答案

您可以使用 rownumber 函数获取从中获取 DataFrameRow 的数据框中的行号。
由于 DataFrameRow 是可变的，您可以像这样编写循环:

for col_index in ["a", "b", "c"]
    for row in eachrow(df)
        if row[col_index] == 0
            row[col_index] = 99
            break
        end
    end
end

最后，像这样做你想做的事情会更快:

for col_index in ["a", "b", "c"]
    col = df[!, col_index]
    loc = findfirst(==(0), col)
    isnothing(loc) || (col[loc] = 99)
end

关于dataframe - 获取 Julia 数据框中一行的索引(类似于 iterrows？)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/66056161/

上一篇：vba - 以五秒为间隔发送电子邮件

下一篇：linq - 无法转换为 system.guid

相关文章：

python - 根据 Pandas 中多列中的值选择数据

r - 将宽数据框分解为两个不均匀的列数据框并将其更改为长格式

python - 如何在不排序的情况下迭代组？

php - SPHINX 仅匹配短语，以及 PHP 中的 SPHINX 自动索引

python - 更新多重索引 np.array 中的元素

c++ - 迭代二维网格子集的最佳方法

python - 如何在 Pandas DF 中按列求和并删除附加行

optimization - 对 Pandas 系列进行迭代需要永远，但我想不出没有它的方法来解决这个问题。有没有更快的方法？

scala - 在scala中将文件的内容存储在不可变的Map中

MySQL:你能指定起始索引吗？