c - 检测重复项的程序

标签 c

我的程序需要检测给定文件中的重复项并用硬链接(hard link)替换它们。它在 Windows 上运行良好(无需链接),但在 Linux 上不起作用。 对于文件夹中的 5 个文件,结果为: List & Results 。它可以在 Windows 上正确检测重复项,但在 Linux 上这些 NULL 可能会阻止它。我尝试在 listFiles 末尾添加 if (对//无效),它会生成良好的列表,但不会在 Windows 上检测到第二个重复项(未在 Linux 上测试)。顺便说一句,我提到底部有斜线,但需要注意。 谢谢帮助。

#include <stdio.h>
#include <string.h>
#include <dirent.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>

int compare(char *file_1, char *file_2);
int listFiles(char *path, int *count, char ***list);
int hardlink (char *path_1, char *path_2);
int is_regular_file(const char *path);

int main()
{
    char path[100];
    int count=0;
    int comp=0;
    char **list=NULL;
    printf("input path: ");
    scanf("%s", path);
    count=listFiles(path,&count,&list);
    printf("%d\n",count);
    if(list==NULL){
        printf("wrong path");
        return 1;
    }
    for(int i=0;i<count;++i)
    {
        printf("%d %s\n",i,list[i]);
    }
    for (int i=0; i<count; ++i){
        for (int j=i+1; j<count; ++j){
            comp= compare(list[i], list[j]);
            if(comp==0&&list[j]!=NULL&&list[i]!=NULL){
                    printf("%s to dup %s\n",list[j],list[i]);
            //        hardlink (list[i], list[j]);
            for(int k=j ;k<count-1;++k){
                list[k]=list[k+1];
            }
            free(list[count]);
            --count;
            }
        }
    }
    for (int i = 0; i < count; ++i)
        free(list[i]);
    free(list);
    return 0;
}
int listFiles(char *basePath,int *count, char ***list)
{
    char path[1000];
    int temp=*count;
    struct dirent *dp;
    DIR *dir = opendir(basePath);
    if (!dir){
        return temp;
    }
    while ((dp = readdir(dir)) != NULL){
        if (strcmp(dp->d_name, ".") != 0 && strcmp(dp->d_name, "..") != 0){
            strcpy(path, basePath);
            strcat(path, "/");
            strcat(path, dp->d_name);
            char *file_path=NULL;
            if (is_regular_file(path)){
            int x=0;
                for( int i =0;path[i]!='\0';++i){
                    file_path=realloc(file_path, (x+1)*sizeof(*file_path));
                    (file_path)[x++] = path[i];
                }
                file_path=realloc(file_path, (x+1)*sizeof(*file_path));
                file_path[x]='\0';
            }
         //   if(file_path!=NULL){
                *list=realloc(*list, (temp+1)*sizeof(**list));
                (*list)[temp++] = file_path;
        //    }
        }
        temp=listFiles(path,&temp,list);
    }
    closedir(dir);
    return temp;
}
int compare(char *file_1, char *file_2)
{
    FILE *data_1 = fopen(file_1,"r");
    FILE *data_2 = fopen(file_2,"r");
    char *temp_1=malloc(10000);
    char *temp_2=malloc(10000);
    if (data_1){
            int x=0;
            int c;
            while ((c = fgetc(data_1)) != EOF){
               (temp_1)[x++] = (char) c;
            }
            temp_1[x] = '\0';
            }
    if (data_2){
            int x=0;
            int c;
            while ((c = fgetc(data_2)) != EOF){
               (temp_2)[x++] = (char) c;
            }
            temp_2[x] = '\0';
            }
            fclose(data_1);
            fclose(data_2);
    if(strcmp(temp_1,temp_2)==0)return 0;
    else return 1;
}
int hardlink (char *path_1, char *path_2){
    int temp= remove(path_2);
    if (temp==0)printf("file %s deleted\n", path_2);
    else {
            printf("can't delete %s\n", path_2);
            return 1;
    }
    int linking = link ( path_1 , path_2 ) ;
    if (linking == 0){
        FILE *fil = fopen (path_2, "r");
        if (fil != NULL){
                printf (" hardlink %s for %s created\n",path_2,path_1);
                fclose(fil);
        }
        else printf("can't create hardlink %s\n", path_2);
        return 0;
    }
    else printf("can't create hardlink %s\n", path_2);
    puts("");
    return 0;
}
int is_regular_file(const char *path)
{
    struct stat path_stat;
    stat(path, &path_stat);
    return S_ISREG(path_stat.st_mode);
}

在列表文件中,您需要更改 strcat(path, "\");到 strcat(路径,“/”);如果你想在 Linux 上工作

最佳答案

您正在为 Linux 和 Windows 使用 strcat(path, "\\");。路径分隔符不相同。

const char separator =
#ifdef _WIN32
                        '\\';
#else
                        '/';
#endif

关于c - 检测重复项的程序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54096374/

相关文章:

c - C语言如何查找句子中的字符

c - 有没有一个示例如何捕获当我用鼠标右键单击任务栏上的图标时的事件?

c - 在定时器 fd 上执行 lseek 时出错

c++ - 对 "fun2()"的 undefined reference

c - 为什么这个简单的程序会崩溃?

c - 什么时候应该使用 mmap 进行文件访问?

c - DisjointSet 的问题

无法访问内存 - gdb

c - 下面程序的输出是什么?

c - BCD转Ascii和Ascii转BCD