我正在为一些机器学习构建 pandas Dataframe。 X Dataframe 有一个日期索引,由我的各种数据文件中的所有现有日期组成:
all_index=set()
for table in data:
for date in table.index.values:
all_index.add(date)
然后我构建我的数据变量,我想在其中合并我拥有的每个数据:
temp2= np.empty((len(all_index),1,))
temp2[:]=np.nan
X=pd.DataFrame(temp2, all_index)
当然,现在我想用数据填充它(数据是1个DF,稍后,它将是一个DF列表):
for i in X.index.values:
for j in data[0].index.values:
if(j==i):
X.at[i, 0] = data['Column Name'][i]
错误是:
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-73-73562c8b1e98> in <module>
8 #X[i]=data[0]['BCH-USD'][i]
9 elem = data[0]['BCH-USD'][str(i)]
---> 10 X.at[i, 0] = elem
11 #print(X[0][i])
12 print(data[0]['BCH-USD'][i])
~\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\core\indexing.py in __setitem__(self, key, value)
2157 key = list(self._convert_key(key, is_setter=True))
2158 key.append(value)
-> 2159 self.obj._set_value(*key, takeable=self._takeable)
2160
2161
~\AppData\Local\Programs\Python\Python37\lib\site-packages\pandas\core\frame.py in _set_value(self, index, col, value, takeable)
2580 series = self._get_item_cache(col)
2581 engine = self.index._engine
-> 2582 engine.set_value(series._values, index, value)
2583 return self
2584 except (KeyError, TypeError):
pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.set_value()
pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.set_value()
pandas/_libs/src\util.pxd in util.set_value_at()
pandas/_libs/src\util.pxd in util.set_value_at_unsafe()
ValueError: setting an array element with a sequence.
我尝试过:
这个错误很奇怪,因为 set_value 已被弃用。文档页面说要使用 .at。并且 .at 使用 set_value...
我还尝试查看变量的类型 type(data['Column Name'][i]) -> 它是 float64
我还尝试使用 pd.is_numeric 进行转换。同样的错误
我尝试在循环中打印出 data['Column Name'][i],没有错误。如果我尝试打印出 X,也没有错误。
如果我尝试不使用循环: X.at['2018-11-24', 0] = data['Column Name'][0] 它有效...
我期望得到:
一个 DataFrame,其中包含多个 csv 文件中的所有日期作为索引,以及 csv 文件中的值(如果可用)作为列。如果不可用,则仅 nan。
最佳答案
错误可能是由于您正在使用链索引,这是您应该避免的。尝试使用:
for i in X.index.values:
for j in data[0].index.values:
if(j==i):
X.at[i, 0] = data['Column Name'].at[i]
另外,请查看此文档:http://pandas.pydata.org/pandas-docs/stable/indexing.html
关于python - 在 Pandas DataFrame 中使用 .at 设置值,出现无法理解的类型错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54168819/