python - groupby - TypeError 'DataFrame' 对象不可调用

标签 python group-by pandas typeerror

这里是新手 - 我的第一次尝试似乎还不错,但这是我第二次使用 pandas。 在 Windows 7 上使用 Pandas 0.12.0 时,我从 SQL 中读取了 2 个数据帧 一个按预期与 groupby 一起工作,所以我确定我的问题不是语法。 但另一方面,当 type(reddf) 返回 pandas.core.frame.DataFrame 时,当尝试 reddf.groupby( 'any column') 我得到 - 最后几行 -

    c:\python27\lib\site-packages\pandas\core\groupby.pyc in __init__(self, index, grouper,     name, level, sort)
   1197             # no level passed
   1198             if not isinstance(self.grouper, np.ndarray):
-> 1199                 self.grouper = self.index.map(self.grouper)
   1200                 if not (hasattr(self.grouper,"__len__") and \
   1201                    len(self.grouper) == len(self.index)):

c:\python27\lib\site-packages\pandas\algos.pyd in pandas.algos.arrmap_int64 (pandas\algos.c:62839)()

TypeError: 'DataFrame' 对象不可调用

我知道 groupby 没问题,并且该列存在,所以数据帧上还有一些我不知道或忽略的其他约束/条件。 那么什么会导致这个错误呢?我该怎么办?我将来应该寻找什么?

请求的信息

print type(reddf.index)
<class 'pandas.core.index.Int64Index'>

print repr(reddf.index) 
Int64Index([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19], dtype=int64)

print type(reddf.index.map)
<type 'instancemethod'>

print repr(reddf.index.map)
<bound method Int64Index.map of Int64Index([0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19], dtype=int64)>

Just in case
reddf gives
<class 'pandas.core.frame.DataFrame'>
Int64Index: 20 entries, 0 to 19
Data columns (total 24 columns):
AssetId                  20  non-null values
DateAdded                20  non-null values
ModelId                  20  non-null values
UsageTypeId              20  non-null values
DateAdded                20  non-null values
Name                     20  non-null values
NatureId                 20  non-null values
IsContainer              20  non-null values
SparePartNumber          8  non-null values
ProductNumber            19  non-null values
SupportCategoryOid       20  non-null values
SerialNumber             20  non-null values
IpAddress                20  non-null values
Description              20  non-null values
CustomsId                15  non-null values
AssetTag                 20  non-null values
ParentId                 5  non-null values
ManagementProcessorId    7  non-null values
OperatingSystem          20  non-null values
OsVersion                20  non-null values
SystemName               20  non-null values
LocationId               10  non-null values
RomVersion               20  non-null values
MacAddress               19  non-null values
dtypes: bool(1), datetime64[ns](2), float64(3), int64(5), object(13)

我在执行 reddf.groupby('ModelId') 时遇到错误,特别是。 谢谢

感谢大家, 重复的字段名称导致了我的问题,我不敢相信我之前没有注意到 最后评论。

现在,我不明白 .index 输出如何消除其他问题,您能详细说明一下吗?如果索引丢失了怎么办,groupby 应该不能正常运行,为什么不呢?只是寻找一个简短的解释,如果你指向代码,那很好。 感谢您的帮助,伙计们。

最佳答案

是由“DateAdded”列重复引起的。重命名它,一切顺利。

关于python - groupby - TypeError 'DataFrame' 对象不可调用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21172271/

相关文章:

python - 根据条件删除行 Python Pandas

python - 无法在一个 View 中更新用户和用户配置文件?

ruby-on-rails - Ruby On Rails、Postgresql - 每分钟组的 Date_Part 或 Extract

python - PYTHON 2.7 中的 AIML 解析错误?

mysql - 根据条件将表与自身连接 t-sql

sql - Oracle - 按多维数据集分组 - 按不同列求和

python - pandas DataFrame,如何将函数应用于特定列?

python - 使用时间窗口的标签回填缺失数据

python - PySpark 不会启动 - ‘python’ : No such file or directory

python - Jupyter notebook 无法识别 Gensim 库