java - 人名消歧

标签 java testing nlp wikipedia

我目前正在做一个关于人名消歧的项目。该项目背后的想法是,当有多个同名的人时,它将能够识别出正确的人。我为此使用了维基百科。我想根据一些标准数据评估我的项目。我正在寻找一些测试数据。我不熟悉维基百科中的流行名称。知道吗,我在哪里可以找到这些数据?我不是在寻找大量数据。我只是在寻找大约 100-500 个示例。

谢谢

向问题添加更多信息。

我要找的是同名但实际上不同的人。例如,Michael Jordon 是一位著名的篮球运动员,还有一位统计学家。我正在寻找这样的例子。

http://en.wikipedia.org/wiki/Michael_Jordan http://en.wikipedia.org/wiki/Michael_I._Jordan

希望您现在明白了这个问题。

最佳答案

关于java - 人名消歧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3852656/

相关文章:

java - 将属性文件加载到 java.util.Properties?

java - 提取字符串,包括字符串中的空格(java)

bash 真/假重定向错误

testing - 在 Salesforce 中测试返回 PageReference 的方法

android - 如何使 MotionEvent 缩放?

nlp - 在斯坦福主题建模工具包 (TMT) 中,主题的数字是什么意思(在输出文件 "summary.txt"中)?

java - 与此 preg_split 等效的 Java 是什么?

python - 我可以做些什么来加速 Stanford CoreNLP (dcoref/ner)?

python - 如何有效地计算 python 中多个文档的二元语法

java - 如何排除字符串日期格式化程序对另一个字符串进行测试?