c - 在c中的文本文件中逐行文本应用二进制搜索

标签 c search text-files binary-search file-handling

我试图在文本文件中搜索一个词,我有点成功,但代码并不总是有效。只是我不明白为什么它在循环内不起作用,但在我手动执行时却起作用。

我知道有很多东西要看,但请任何人帮助我。

#include <stdio.h>
#include<string.h>
#include<stdlib.h>
#include<ctype.h>

void main()
{
    FILE *fp;
    fp=fopen("testdictionary.txt","r");

    char word[]="her";
    char line[7];
    int n;
    int upper_limit=48;
    int lower_limit=0;
    int result=-1;

    while(result!=0) {
        n=(upper_limit+lower_limit)/2;
        printf("Value of n:%d ",n);
        fseek(fp,n,SEEK_SET);

        // setting the file pointer to the beginning of the word. --
        fseek(fp,-1,SEEK_CUR);
        char tst;
        do {
            fseek(fp,-1,SEEK_CUR);
            if(ftell(fp)==0) {
                break;
            }

            tst=fgetc(fp);
            if(tst=='\n') {
                break;
            }

            fseek(fp,-1,SEEK_CUR);
        } while(tst!='\n');
        //----------------------------------------------------------

        fgets(line,7,fp);
        result=strcmp(line,strcat(word,"\n"));
        printf(" Result:%d ",result);

        if(result==1) {
            upper_limit=n;
            printf("Required 'word' is above the line of text.\n");
        }
        else if(result==-1) {
            lower_limit=n;
            printf("Required 'word' is below the line of text.\n");
        }
        else if(result==0) {
            printf("Word found");
        }
    }
}

我的文本文件

aoo
bpp
cas
dzx
edf
fvb
gty
her
iwe
jqw

输出(当我运行上面的代码时。)

Value of n:24  Result:-1 Required 'word' is below the line of text.
Value of n:36  Result:-1 Required 'word' is below the line of text.
Value of n:1322  Result:1 Required 'word' is above the line of text.
Value of n:329639  Result:1 Required 'word' is above the line of text.
Value of n:84052197

我不明白的部分是,如果我手动输入 n=36,结果显示 0 并且找到了单词。但是当我尝试自动搜索时,即使在第 2 步之后 n 的值变为 36,循环不会中断并给出奇怪的大 n 值。

所以当我自己输入 n=36(如下所示)时,我得到了预期的输出,即找到了“her”这个词。

while(result!=0)
{
    // n=(upper_limit+lower_limit)/2;
    n=36;
    printf("Value of n:%d ",n);
    fseek(fp,n,SEEK_SET);

输出

Value of n:36  Result:0 Word found
Process returned 10 (0xA)   execution time : 0.141 s
Press any key to continue.

我不知道这是否是您应该进行二分查找的方式,但这就是我所知道的。我只是编程的初学者。

最佳答案

函数strcmp不返回具体 -11 (尽管它可能会)。它返回值 0 , < 0> 0 .

也在

result = strcmp(line, strcat(word, "\n"));

你不能将任何东西连接到

char word[] ="her";

因为数组没有空间了。最好从文件字符串中删除换行符,而不是将其添加到目标字符串中。

即使可以,您也会在每次迭代中添加另一个换行符。所以我建议

fgets(line, 7, fp);
line [ strcspn(line, "\r\n") ] = '\0';      // truncate any newline
result = strcmp(line, word);
if(result > 0) {
    upper_limit = n;
    printf("Required 'word' is above the line of text.\n");
}
else if(result < 0) {
    lower_limit = n;
    printf("Required 'word' is below the line of text.\n");
}
else {   // no other possibility
    printf("Word found");
}

关于c - 在c中的文本文件中逐行文本应用二进制搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54948446/

相关文章:

c - 我是否需要为每个 C POSIX 线程使用不同的签名集以确保屏蔽信号时的原子性?

PHP PDO MySQL 查询 LIKE -> 多个关键字

php - 为什么 PHP 函数 imap_search() 很慢?

javascript - Jquery,在嵌套数组上使用 "inarray"来查找特定值的索引?

c - 以十列打印到 txt 文件?

PHP删除文本文件中的最后一个空行

java - 如何确定从 Java 文本文件中读取的最大值和最小值

c - SIMD编程: "mode ' V4SF' applied to inappropriate type"error

c++ - binary_log_types.h : No such file or directory

C linux共享内存不能存储大整数值