Java 语言检测在给定相同输入的情况下返回不同的概率

我正在使用 Java language-detection库的方式如下:

Detector detector = DetectorFactory.create(); //profiles are in the default location
detector.append("What language is this text?");
List<Language> languages = detector.getProbabilities();
Language mostProbable = languages.get(0);
System.out.println(mostProbable.lang + " - " + mostProbable.prob);

在输入完全相同的情况下，prob 值在不同的执行过程中略有不同。这是“正常”吗？这取决于什么？

最佳答案

如果库使用的算法/方法不确定，则每次执行的值可能会有所不同。

例如，某些算法需要给予初始种子才能开始。在很多情况下，这个种子是(伪)随机选择的。这会影响最终输出。

编辑:看起来该库正在使用朴素贝叶斯分类器(可能是或)。

关于Java 语言检测在给定相同输入的情况下返回不同的概率，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19717535/

上一篇：业务逻辑与 ejb 分离的 Java EE 应用程序

下一篇：java - 构建和注入(inject)客户端

相关文章：

python - 使用 Python 检测文件中的语言更改

java.lang.UnsupportedOperationException : Can't convert to color: type=0x2 异常

java - 我可以在另一个类中使用一个类的代码(构造函数+方法)吗？ (java)

Java连接Get请求异常处理

java - 字符串值时区排序

java - 我如何通过 tika 检测波斯语网页？

java - 如何创建一个模态 Activity ，在完成()后在后台 Activity 上引发代码？

python - 在 python : "No features in text" 中使用 langdetect 时出错

nlp - 非常短文本的语言检测