python - Dask 中的索引存在数据左移 q 的问题

我正在尝试在 Dask 中读取 CSV。它读取所有列，但将它们向左移动 1。因此，应该位于第一列下的数据成为索引，第二列成为第一列，依此类推，最后一列全部为 NaN。

一个例子 -

a,b,c
1,2,3
4,5,6
7,8,9

在 Dataframe 中，它看起来像这样 -

  a,b,c
1 2,3,Nan
4 5,6,Nan
7 8,9,Nan

Pandas 具有 index_col=False 功能，可以让我避免这种情况。 Dask 中有什么东西可以让我这样做吗？

最佳答案

我希望您拥有与所显示的数据不同的数据，因为它工作正常:

In []: with open('temp.csv', 'w') as f:
    f.write("""a,b,c
    1,2,3
    4,5,6
    7,8,9""")

In []: dd.read_csv('temp.csv').compute()
Out[]: 
   a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

这与 pandas.read_csv 给出的输出完全相同。

您可以使用 skiprows= 和 names= 是您的文件头会导致问题。

关于python - Dask 中的索引存在数据左移 q 的问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55119821/

上一篇：python - 使用 Python 3.x 添加特定大小的列

下一篇：python - 如何向现有 DataFrame 添加新列？

相关文章：

python - 以编程方式生成要放入Python字典中的键和值

python - 无法在 python 中将字母数字转换为字符串

python - 获取 Pandas 中 3 个月的平滑移动组的总和数据

r - 扩展 “from”和 “to”列定义的范围

python - 将数据框列分解为多行

python - 如何控制python的ThreadPoolExecutor的吞吐速度？

python - Python 中 DB 绑定(bind)服务器的 TNonblockingServer、TThreadPoolServer 的性能

python - 如何在函数内重新索引 pandas 数据框？

python - "index.week"使用 iterrows 时进行过滤

python - Pandas 根据日期之间的间隔创建行