java - 如何检查停用词文件是否损坏或错误

标签 java file char boolean newline

我有一个包含数百个停用词的文件。例如,我希望能够检查文件是否已被用户修改,甚至是否已损坏。

我目前考虑的方法是查看行数是否正确。我还可以检查字符总数是否是预期的,甚至可以将整个停用词列表加载到内存中,以检查它们中的每一个是否都在文件中。我想到的所有 3 种方法似乎效率低下和/或不好,所以我想问问是否有更好的方法。

我正在考虑实现的内容:

private static final int WORD_COUNT = 354;

    public static boolean stopwordsCorrupted(File file) {
        int numOfLines = countLines(file);

        return WORD_COUNT != numOfLines;
    }

最佳答案

看看这个:http://en.wikipedia.org/wiki/Checksum这使用文件的 hashfuntion 来检查是否没有进行任何更改

Here您还有一个如何使用它的示例。

关于java - 如何检查停用词文件是否损坏或错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23846028/

相关文章:

java - 在偏向图中找出所有可能的哈密尔顿圈

java - iphone - 使用 java/html/css/javascript 在表单上自动弹出键盘?

c++ - 如果我不关闭,ifstream 会导致内存泄漏吗?

我可以安全地将 &char[] 转换为 char** 吗?

java - 如何在JPA中查询值为空的列?

JavaFX Timeline/KeyFrame - 传递的值不正确

file - 用fortran链接多个文件

c++ - 如何从文件中读取特征矩阵?

c++ - 如何获取 const* char 参数的键盘输入?

c++ - Char 到 int8_t 的转换给出了意想不到的结果?