php - 命名实体识别算法

标签 php python extract analysis named-entity-recognition

我想使用命名实体识别 (NER) 来为数据库中的文本找到足够的标签。

我知道有一篇关于此的 Wikipedia 文章以及许多其他描述 NER 的页面,我希望从您那里听到有关此主题的一些信息:

  • 您对各种算法有何经验?
  • 您会推荐哪种算法?
  • 哪种算法最容易实现(PHP/Python)?
  • 算法如何工作?是否需要手动培训?

例子:

“去年,我在伦敦见到了巴拉克奥巴马。” => 标签:伦敦,巴拉克奥巴马

我希望你能帮助我。非常感谢您!

最佳答案

首先结帐http://www.nltk.org/如果你打算使用 python,虽然据我所知代码不是“工业实力”,但它会让你开始。

查看 http://nltk.googlecode.com/svn/trunk/doc/book/ch07.html 中的第 7.5 节但要理解这些算法,您可能需要阅读大量书籍。

还可以查看 http://nlp.stanford.edu/software/CRF-NER.shtml .它是用java完成的,

NER 不是一个简单的主题,可能没有人会告诉你“这是最好的算法”,他们中的大多数都有自己的优缺点。

我的 0.05 美元。

干杯,

关于php - 命名实体识别算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1026925/

相关文章:

python - 如何匹配一行中第一个字符之后的字符串

python - 理解 NumPy 的 einsum

PHP mysql如何关联三个表显示不同表的输出

php - 澄清 BlackBerry Messenger QRCode 格式。

php - 无法导出数据库并出现 Mysql 转储错误 2020 :

java - 使用htmlunit提取html内容

javascript - 使用正则表达式从字符串中提取十六进制代码

php - 无法将 MySQL 查询转换为字符串

python - 当 NaN 包含在索引中时,如何有效地删除?

regex - hive 中的功能regex_extract