machine-learning - 可能性是针对整个训练集还是单个示例计算的?

标签 machine-learning probability mle language-model

假设我有一个(x, y)对的训练集,其中x是输入示例,y是相应的目标y 是一个值 (1 ... k)(k 是类的数量)。

在计算训练集的似然度时,是否应该针对整个训练集(所有的例子)进行计算,即:

L = P(y | x) = p(y1 | x1) * p(y2 | x2) * ...

或者是针对特定训练示例计算的可能性(x, y)

我问是因为我看到了这些lecture notes (第 2 页),他似乎在计算 L_i,即分别计算每个训练示例的可能性。

最佳答案

似然函数描述了在给定一些参数的情况下生成一组训练数据的概率,并且可用于查找以最大概率生成训练数据的那些参数。您可以为训练数据的子集创建似然函数,但这不能代表整个数据的可能性。然而,您可以做的(以及在讲义中显然默默完成的)是假设您的数据是 independent and identically distributed (iid) 。因此,您可以将联合概率函数拆分为更小的部分,即 p(x|theta) = p(x1|theta) * p(x2|theta) * ... (基于独立性)假设),并且您可以对每个部分使用具有相同参数(theta)的相同函数,例如正态分布(基于同一性假设)。然后,您可以使用对数将乘积转换为总和,即 p(x|theta) = p(x1|theta) + p(x2|theta) + ...。该函数可以通过将其导数设置为零来最大化。由此产生的最大值是 theta,它以最大概率创建您的 x,即您的最大似然估计。

关于machine-learning - 可能性是针对整个训练集还是单个示例计算的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30640125/

相关文章:

r - R : initial value in 'vmmin' is not finite 中的 MLE 错误

python - 从 Dask Dataframe 中获取一行而不将整个 Dataframe 加载到内存中

scala - 如何创建一个估计器来在拟合初始数据集后训练新样本?

python - Pandas 和 scikit-learn : KeyError: [. ...] 不在索引中

algorithm - 将分数转化为概率

c++ - C++ 可以在内部表示而无需舍入的 0 和 1 之间的最大和最小数字是多少?

r - 错误概率函数

matlab - 使用 mle() 估计自定义分布的参数

python - 我无法使用使用 pandas Dataframes 作为参数的生成器创建 Dataset.from_generator()

python - 使用 statsmodels 进行最大似然估计会使事情变得过于复杂?希望大家推荐