artificial-intelligence - 自动化新闻报道

标签 artificial-intelligence machine-learning

名为 StatSheet 的网络应用程序今天(2010 年 8 月 4 日)获得资助

http://techcrunch.com/2010/08/04/former-crunchies-finalist-statsheet-recieves-1-3-million-in-series-a/

他们正在做“自动化新闻”——使用计算机根据统计数据生成类似人类的体育比赛报告

http://www.guardian.co.uk/media/pda/2010/mar/30/digital-media-algorithms-reporting-journalism

有人知道使用什么方法/算法来做到这一点/如何复制它吗?

最佳答案

此类项目的详细信息有点稀疏,但看起来像棒球摘要 Stats Monkey组成:

  1. 统计模型:他们构建了棒球比赛通常如何展开的模型,最有可能通过观察某些变量(例如跑动、击球数等)在比赛过程中如何变化。一场比赛或与您期望在比赛中看到的情况不同(例如,无名球队比备受青睐的球队得分更高)。给定的游戏适合(或不适合)该模型的程度让他们了解该游戏可能有趣的地方(例如关键玩法或玩家)。

  2. 文本生成:给定一个预先写好的叙述弧库(例如来回游戏、后来者获胜等),他们使用“有趣的信息” 》从游戏的模型来构建游戏的概要。我不确定,但看起来他们使用决策树(以模型中的信息为条件)来选择这些弧之一。

  3. 杂项粘合:他们的文章中没有提到这一点,但我认为有相当多的硬编码规则可以“粘合”主要叙述弧线成一个单一的、有凝聚力的故事。

Stats Monkey 的作者在相关领域进行了大量研究,例如网站摘要以及自动内容聚合和生成。以下是一些可能有趣的论文:

关于artificial-intelligence - 自动化新闻报道,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3415214/

相关文章:

algorithm - 国际象棋:Alpha-Beta 中的错误

artificial-intelligence - 对于一群本科生来说,你对一个好的人工智能项目有什么想法?

python - 机器学习中计算机决策的概率?

python - 我的模型具有较高的准确度和 val_accuracy,但在测试数据上给出错误的结果

python - scikit-learn 查询数据维度必须匹配训练数据维度

python - 为什么我的基于 minimax 算法的 tic-tac-toe 播放器并不完美?

python - 对整个文档进行语义搜索的正确方法?

tensorflow - 机器学习: why the cost function does not need to be derivable?

algorithm - 蒙特卡洛与 UCB 应用于复杂的纸牌游戏

machine-learning - 互信息和预测准确性