所以我使用 statsmodel 包对我的数据集进行泊松回归,我确保我的训练 y 确实是计数和整数。但是,当我打印预测值(下面的测试模式)时,它们是 float 。
我非常困惑,我希望它们是整数,因为输入数据和拟合到模型的数据是整数,而泊松输出计数数据。你知道我哪里错了吗?预先非常感谢。
import statsmodels.api as sm
poi_model = sm.GLM(trainingy,trainingx, family=sm.families.Poisson())
poi_results = poi_model.fit()
paramet = poi_results.params
testmodely = poi_model.predict(paramet, testx, linear=False)
最佳答案
泊松模型预测均值,即泊松随机变量的期望值或强度。这通常不是整数。假设分布假设是正确的,使用泊松强度我们可以获得新观测值的完整分布。
这类似于逻辑回归或 logit,其中预测是观察事件或类别的概率。这也是相应随机变量的平均值或期望值。 在分类问题中,概率被最可能的类别的分配所取代,该类别是二进制 0、1,而不是实数。
关于machine-learning - statsmodel 泊松预测返回 float 而不是整数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49416697/