我正在尝试在 Dask 中读取 CSV。它读取所有列,但将它们向左移动 1。因此,应该位于第一列下的数据成为索引,第二列成为第一列,依此类推,最后一列全部为 NaN。
一个例子 -
a,b,c
1,2,3
4,5,6
7,8,9
在 Dataframe 中,它看起来像这样 -
a,b,c
1 2,3,Nan
4 5,6,Nan
7 8,9,Nan
Pandas 具有 index_col=False
功能,可以让我避免这种情况。 Dask 中有什么东西可以让我这样做吗?
最佳答案
我希望您拥有与所显示的数据不同的数据,因为它工作正常:
In []: with open('temp.csv', 'w') as f:
f.write("""a,b,c
1,2,3
4,5,6
7,8,9""")
In []: dd.read_csv('temp.csv').compute()
Out[]:
a b c
0 1 2 3
1 4 5 6
2 7 8 9
这与 pandas.read_csv
给出的输出完全相同。
您可以使用 skiprows=
和 names=
是您的文件头会导致问题。
关于python - Dask 中的索引存在数据左移 q 的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55119821/