linux - 为什么更频繁地读取磁盘会使 Linux 上的每次读取速度更快? QPS1 对比 50

标签 linux io

我在带有 SATA 磁盘的 Linux 机器上对同步读取性能进行基准测试。对于单线程读取,奇怪的是较高的 QPS(50) 在读取 300 个条目后平均读取时间为 12 毫秒,而较低的 QPS(1) 在读取相同的 300 个条目后平均读取时间为 63 毫秒。有什么解释吗?

代码和数据如下:

struct Request{
    unsigned long long len;
    unsigned long long offset;
    int                fd;
};

int read_request(Request* request){
    char* buf = (char*)malloc(request->len);
    off_t of = lseek(request->fd,request->offset,SEEK_SET);
    assert(of == request->offset);

    int len = read(request->fd,buf,request->len);
    assert(len == request->len);
    free(buf);
    return 0;
}




 int read_with_qps(Request* request,int request_num,Files* f,int mode,int qps){

    int interval = 1000 / qps;
    struct timeval start,end;
    for(int i  = 0 ; i < request_num ; i++){
        gettimeofday(&start,NULL);
        int ret = read_request(&request[i]);
        gettimeofday(&end,NULL);
        int time_used = (end.tv_sec - start.tv_sec) * 1000 + (end.tv_usec - start.tv_usec)/1000;
        fprintf(stderr,"%lld,offset=%lld,len=%lld, read time:%d,ret=%d,mode=%d\n",
                end.tv_sec,request[i].offset,request[i].len,time_used,ret,mode);
        if(time_used < interval){
            usleep((interval - time_used) * 1000);
        }
    }
    return 0;
}

在 QPS=50 的情况下,输出示例如下所示(在计算平均时间时忽略时间 < 4 毫秒,这被认为是命中页面缓存):

1332233329,offset=1052299215,len=13186, read time:13,ret=0,mode=1
1332233329,offset=2319646140,len=1612, read time:10,ret=0,mode=1
1332233330,offset=1319250005,len=5654, read time:12,ret=0,mode=1
1332233330,offset=2520376009,len=2676, read time:12,ret=0,mode=1
1332233330,offset=2197548522,len=17236, read time:10,ret=0,mode=1
1332233330,offset=1363242083,len=13734, read time:11,ret=0,mode=1
1332233330,offset=4242210521,len=2003, read time:17,ret=0,mode=1
1332233330,offset=1666337117,len=2207, read time:10,ret=0,mode=1
1332233330,offset=797722662,len=5480, read time:18,ret=0,mode=1
1332233330,offset=1129310678,len=2265, read time:10,ret=0,mode=1

QPS=1,smaple同提取物:

1332300410,offset=1052299215,len=13186, read time:19,ret=0,mode=1
1332300411,offset=2319646140,len=1612, read time:40,ret=0,mode=1
1332300412,offset=1319250005,len=5654, read time:141,ret=0,mode=1
1332300413,offset=2520376009,len=2676, read time:15,ret=0,mode=1
1332300414,offset=2197548522,len=17236, read time:21,ret=0,mode=1
1332300415,offset=1363242083,len=13734, read time:13,ret=0,mode=1
1332300416,offset=4242210521,len=2003, read time:43,ret=0,mode=1
1332300417,offset=1666337117,len=2207, read time:18,ret=0,mode=1
1332300418,offset=797722662,len=5480, read time:67,ret=0,mode=1
1332300419,offset=1129310678,len=2265, read time:12,ret=0,mode=1

内核版本为:2.6.18-194.el5 SMP x86_64

$ cat /sys/block/sda/queue/scheduler
noop anticipatory deadline [cfq]

谢谢回复

最佳答案

当您发出一堆查询时,驱动器固件可以将它们排队并根据旋转位置和头部位置(“电梯搜索”)以优化的顺序执行它们,因此它不必等待完整的搜索时间或每个 i/o 请求的磁盘旋转时间。

如果您缓慢地发出相同的查询,则没有这样的优势。

关于linux - 为什么更频繁地读取磁盘会使 Linux 上的每次读取速度更快? QPS1 对比 50,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9798280/

相关文章:

android - Debian 8.3 Jessie 64 位上的 AAPT 错误

linux - 使用 grep 从字典中删除词根已经存在的单词

Java:写入期间意外退出

c# - 将信息存储在文件中 - 什么方式?

c - 删除文件之前需要fsync吗?

haskell - 提高基于线路的导管性能的方法

linux - 当为可执行文件设置 set-user-ID 时, `exec` 如何以及何时更改有效用户 ID

mysql - 如何读取/转换包含\040 而不是空格的 mysql 历史记录 (.mysql_history)?

创建一个新的瘦进程、 fork 还是线程?

c++ - 当文件数量少于预期时正确处理输入