java - 使用 Java 进行命名实体识别

标签 java tags nlp semantics

我想使用命名实体识别 (NER) 为数据库中的文本找到足够的标签。我不想使用像 NLTK 或 Lingpipe 这样的工具,而是想构建自己的工具。

所以我的问题是:

  • 我应该使用哪种算法?

  • 构建这个工具有多难?

最佳答案

我前段时间研究马尔可夫链的时候就是这样做的。

无论如何,答案是:

Which algorithm should I use?

例如,斯坦福 NLP 使用条件随机场 (CRF)。如果您没有尝试有效地做到这一点,那么您就像《Jackass 3d》中在风中撒尿 的家伙。没有简单的方法来解析人类语言,因为它的结构很复杂并且有很多异常(exception)。

How hard is to build this tool?

好吧,如果您知道自己在做什么,那么一点也不难。输入规则和逻辑的过程可能很烦人且耗时,修复错误可能很重要。但在 20 年内,你可以做出几乎有用的东西(对你自己)。

关于java - 使用 Java 进行命名实体识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5571519/

相关文章:

java - Android 应用程序将无法运行

Java YouTube正则表达式获取视频ID和时间戳

java - 为什么 JBoss EAP 6.4 无法使用 http session 复制机制加载 session ?

jsp - 如何找到 cq :includeClientLib tag? 将包含的文件

python - Spacy "is a"挖矿

java - 如何使用 Simbad 3d 机器人模拟器实现/执行新代码,错误 : Could not find or load main class Example1

ios - 同一个 ViewController 上的 2 个 PickerViews - titleForRow 基金 "will not be executed"

PHP htmlentities 只允许 <b> 和 <i>

nlp - 改进 sklearn 中的预测

python - 使用 Hugging Face Transformers 库你怎么能 POS_TAG 法语文本