python - dask 条件选择 - iloc 缺失

标签 python dask

如何实现

df.loc[df.some_string_column == '', 'some_string_column'] = np.nan

在黄昏? Das 似乎不支持使用 bloc/loc 索引器。我得到的错误是

TypeError: '_LocIndexer' object does not support item assignment

最佳答案

一般来说,在 dask 中,您必须使用赋值来创建新的数据帧,而不是改变现有的数据帧;尽管语法相似,但正在创建一个新的计算图。在您的情况下,这可能看起来像:

df['some_string_column'] = df.some_string_column.map(
    lambda x: x if x else np.nan))

df['some_string_column'] = df.some_string_column.where(
    df.some_string_column != '', np.nan)

关于python - dask 条件选择 - iloc 缺失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44062868/

相关文章:

python - 如何将单个 parquet 文件从 s3 读取到 dask 数据帧中?

python - 除了iloc(愿意使用Dask)之外,是否有更快的方法将列分配给数据框(有条件)

python - PyFtpdLib 如何在仍在运行服务器时添加用户

python - 如何从自身重新加载 python 模块?

dask - 使用 Dask 将大型 csv 拼花 - OOM

在 Dask 中排序

java - 用于创建工程图的库/语言

python - 如何使用 MultiIndex 索引和 MultiIndex 列对 Pandas DataFrame 进行切片?

python - 在python中运行两个相互依赖的while循环?

dask - 如何将多个参数传递给 dask.distributed.Client().map?