python - 在 Pandas DataFrame 中使用 .at 设置值,出现无法理解的类型错误

标签 python pandas dataframe setvalue

我正在为一些机器学习构建 pandas Dataframe。 X Dataframe 有一个日期索引,由我的各种数据文件中的所有现有日期组成:

all_index=set()
for table in data:
    for date in table.index.values:
        all_index.add(date)

然后我构建我的数据变量,我想在其中合并我拥有的每个数据:

temp2= np.empty((len(all_index),1,))
temp2[:]=np.nan
X=pd.DataFrame(temp2, all_index)

当然,现在我想用数据填充它(数据是1个DF,稍后,它将是一个DF列表):

for i in X.index.values:
    for j in data[0].index.values:
        if(j==i):
            X.at[i, 0] = data['Column Name'][i]

错误是:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-73-73562c8b1e98> in <module>
      8             #X[i]=data[0]['BCH-USD'][i]
      9             elem = data[0]['BCH-USD'][str(i)]
---> 10             X.at[i, 0] = elem
     11             #print(X[0][i])
     12             print(data[0]['BCH-USD'][i])

~\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\core\indexing.py in __setitem__(self, key, value)
   2157         key = list(self._convert_key(key, is_setter=True))
   2158         key.append(value)
-> 2159         self.obj._set_value(*key, takeable=self._takeable)
   2160 
   2161 

~\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\core\frame.py in _set_value(self, index, col, value, takeable)
   2580             series = self._get_item_cache(col)
   2581             engine = self.index._engine
-> 2582             engine.set_value(series._values, index, value)
   2583             return self
   2584         except (KeyError, TypeError):

pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.set_value()

pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.set_value()

pandas/_libs/src\util.pxd in util.set_value_at()

pandas/_libs/src\util.pxd in util.set_value_at_unsafe()

ValueError: setting an array element with a sequence.

我尝试过:

这个错误很奇怪,因为 set_value 已被弃用。文档页面说要使用 .at。并且 .at 使用 set_value...

我还尝试查看变量的类型 type(data['Column Name'][i]) -> 它是 float64

我还尝试使用 pd.is_numeric 进行转换。同样的错误

我尝试在循环中打印出 data['Column Name'][i],没有错误。如果我尝试打印出 X,也没有错误。

如果我尝试不使用循环: X.at['2018-11-24', 0] = data['Column Name'][0] 它有效...

我期望得到:

一个 DataFrame,其中包含多个 csv 文件中的所有日期作为索引,以及 csv 文件中的值(如果可用)作为列。如果不可用,则仅 nan。

最佳答案

错误可能是由于您正在使用链索引,这是您应该避免的。尝试使用:

for i in X.index.values:
    for j in data[0].index.values:
        if(j==i):
            X.at[i, 0] = data['Column Name'].at[i]

另外,请查看此文档:http://pandas.pydata.org/pandas-docs/stable/indexing.html

关于python - 在 Pandas DataFrame 中使用 .at 设置值,出现无法理解的类型错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54168819/

相关文章:

python - 限制我的程序通过 SQS 发送过多 SES 电子邮件的速率

python - 多次拟合回归并收集汇总统计数据

scala - Spark distinct 的实现

python - 在 DataFrame 中查找最近的时间

Python:将数据框写入现有的Excel,其中包含带有图像的工作表

python - django/python : Google doc viewer issue with . docx/.xlsx/.pptx

python - 基于公共(public)列合并多个数据框

Python导入编译函数

python - 如何在 pandas 数据帧中使用单热编码有效地规范化列?

python - ValueError : Buffer dtype mismatch, 预期 'double' 但得到 'float'