c - 使用多线程时如何检测数据丢失的位置

标签 c linux multithreading operating-system pthreads

我有一个程序可以让多个线程将条目插入哈希表并检索它们。哈希表本身是一个非常简单的实现,它有一个定义每个桶条目的结构和一个用于保存每个桶的表(数组)。我对并发和多线程非常陌生,但我认为为了避免数据在插入和读取操作期间在表中丢失,需要添加某种同步(以互斥锁定的形式)以避免一个进程的数据操作被另一个进程抢占。

但在实践中,我不太确定如何判断进程在哈希表上的数据读取或写入操作中可以在何处被抢占,以及应该在何处放置锁以避免此类问题和死锁。根据 this网站,对于哈希表插入方法,我在每个键插入表之前添加了一个互斥锁,并在函数结束时将其解锁。我基本上在从哈希表读取数据的函数中做了类似的事情,当我运行代码时,似乎最初成功插入了键,但是当应该检索键时程序挂起。以下是我如何为每个函数实现锁定:

// Inserts a key-value pair into the table
void insert(int key, int val) {
    pthread_mutex_lock(&lock);
    int i = key % NUM_BUCKETS;
    bucket_entry *e = (bucket_entry *) malloc(sizeof(bucket_entry));
    if (!e) panic("No memory to allocate bucket!");
    e->next = table[i];
    e->key = key;
    e->val = val;
    table[i] = e;
    pthread_mutex_unlock(&lock);
    pthread_exit(NULL);
}

// Retrieves an entry from the hash table by key
// Returns NULL if the key isn't found in the table
bucket_entry * retrieve(int key) {
    pthread_mutex_lock(&lock);
    bucket_entry *b;
    for (b = table[key % NUM_BUCKETS]; b != NULL; b = b->next) {
        if (b->key == key) return b;
    }
    pthread_mutex_unlock(&lock);
    pthread_exit(NULL);
    return NULL;
}

所以这里的主要问题是:

  1. 如何判断每个线程操作之间数据丢失的位置

  2. 当从哈希表中检索键时,什么会导致程序挂起?

最佳答案

首先,您应该阅读更多关于 pthreads 的信息.另请阅读 pthreads(7) .特别注意每个锁定调用,如 pthread_mutex_lock以后应该总是调用pthread_mutex_unlocksame 互斥体上(并且通常你应该采用纪律每次锁定和解锁都发生在same block 中).因此,您在 retrievefor 循环中的 return 是错误的,您应该编码:

bucket_entry * 
retrieve(int key) {
  bucket_entry *res = NULL;
  pthread_mutex_lock(&lock);
  for (bucket_entry *b = table[key % NUM_BUCKETS]; 
       b != NULL; b = b->next) {
     if (b->key == key) 
        { res = b; break; };
  }
  pthread_mutex_unlock(&lock);
  return res;
}

然后你可以使用valgrind并使用最近 GCC编译器(例如 2015 年 11 月的 5.2)。编译所有警告和调试信息 (gcc -Wall -Wextra -g -pthread)。阅读有关 sanitizer 的信息 debugging options ,特别是考虑使用 -fsanitize=thread

调用pthread_exit 的理由很少(同样,您很少在程序中调用exit)。当您这样做时,整个当前线程将被终止。

关于c - 使用多线程时如何检测数据丢失的位置,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33729882/

相关文章:

c - 编程 MacOS-X 和 Linux API - POSIX 兼容?

c - 多重递归

c - 使用网络内核扩展监控网络数据包

linux - 卡利Linux "could not resolve host github.com"错误

c - 自由指针使用的长度值(整数)

linux - 根据时间启动和终止进程

Java - 将工作拆分到多个线程

C:与 NULL 比较

c - 函数调用是现代平台的有效内存屏障吗?

java - 如何更改线程执行顺序,使最后创建的线程先运行?