python - Dask 中的索引存在数据左移 q 的问题

标签 python pandas dataframe dask

我正在尝试在 Dask 中读取 CSV。它读取所有列,但将它们向左移动 1。因此,应该位于第一列下的数据成为索引,第二列成为第一列,依此类推,最后一列全部为 NaN。

一个例子 -

a,b,c
1,2,3
4,5,6
7,8,9

在 Dataframe 中,它看起来像这样 -

  a,b,c
1 2,3,Nan
4 5,6,Nan
7 8,9,Nan

Pandas 具有 index_col=False 功能,可以让我避免这种情况。 Dask 中有什么东西可以让我这样做吗?

最佳答案

我希望您拥有与所显示的数据不同的数据,因为它工作正常:

In []: with open('temp.csv', 'w') as f:
    f.write("""a,b,c
    1,2,3
    4,5,6
    7,8,9""")

In []: dd.read_csv('temp.csv').compute()
Out[]: 
   a  b  c
0  1  2  3
1  4  5  6
2  7  8  9

这与 pandas.read_csv 给出的输出完全相同。

您可以使用 skiprows=names= 是您的文件头会导致问题。

关于python - Dask 中的索引存在数据左移 q 的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55119821/

相关文章:

python - 以编程方式生成要放入Python字典中的键和值

python - 无法在 python 中将字母数字转换为字符串

python - 获取 Pandas 中 3 个月的平滑移动组的总和数据

r - 扩展 “from”和 “to”列定义的范围

python - 将数据框列分解为多行

python - 如何控制python的ThreadPoolExecutor的吞吐速度?

python - Python 中 DB 绑定(bind)服务器的 TNonblockingServer、TThreadPoolServer 的性能

python - 如何在函数内重新索引 pandas 数据框?

python - "index.week"使用 iterrows 时进行过滤

python - Pandas 根据日期之间的间隔创建行