dataframe - 获取 Julia 数据框中一行的索引(类似于 iterrows?)

标签 dataframe indexing iteration julia

在 Julia 中遍历 df 时,有没有办法获取行的索引和行对象?如果没有,即使找到行索引的方法也会很棒,因为我可以简单地使用 eachrow() 然后找到迭代行的索引,尽管我认为考虑到命名这不太可能Julia 并不真正支持 df 的索引。

对于上下文,我需要索引以便在 df 的每一列中找到第一次出现的 0,以便我可以将其替换为另一个值(例如 99)。为此,我想遍历 df 中每一列的所有行。例如对于 df = DataFrame(a = [1, 0, 2], b = [0, 1, 0], c = [0, 0, 4]) 代码:

for col_index in ["a", "b", "c"]
    for row in eachrow(select(df, :i))
        if row[1] == 0
            df[row.index, :i] = 99
            break
        end
    end
end

会把 df 变成

1 99 99
99 1 0 
2 0 4

很抱歉,如果这是一个愚蠢的问题,尽管我无法在网上找到任何与我的目标相关的信息。

最佳答案

  1. 您可以使用 rownumber 函数获取从中获取 DataFrameRow 的数据框中的行号。
  2. 由于 DataFrameRow 是可变的,您可以像这样编写循环:
for col_index in ["a", "b", "c"]
    for row in eachrow(df)
        if row[col_index] == 0
            row[col_index] = 99
            break
        end
    end
end
  1. 最后,像这样做你想做的事情会更快:
for col_index in ["a", "b", "c"]
    col = df[!, col_index]
    loc = findfirst(==(0), col)
    isnothing(loc) || (col[loc] = 99)
end

关于dataframe - 获取 Julia 数据框中一行的索引(类似于 iterrows?),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66056161/

相关文章:

python - 根据 Pandas 中多列中的值选择数据

r - 将宽数据框分解为两个不均匀的列数据框并将其更改为长格式

python - 如何在不排序的情况下迭代组?

php - SPHINX 仅匹配短语,以及 PHP 中的 SPHINX 自动索引

python - 更新多重索引 np.array 中的元素

c++ - 迭代二维网格子集的最佳方法

python - 如何在 Pandas DF 中按列求和并删除附加行

optimization - 对 Pandas 系列进行迭代需要永远,但我想不出没有它的方法来解决这个问题。有没有更快的方法?

scala - 在scala中将文件的内容存储在不可变的Map中

MySQL:你能指定起始索引吗?