我们正在开发基于 Cyclone V 的定制板。它是一个运行嵌入式 Linux 内核 3.10-ltsi 的 FPGA+ARM Soc。我们的预期应用程序是通过 TCP 千兆以太网将内存中 50-400MB 范围内的大量原始数据发送到运行在 Windows 7 上的 Java 客户端。 iperf 显示我们板子的 TCP 吞吐量在 6xxMBit/s 范围内。 问题: 1.我们有一个需求,我们需要在一定的时间间隔内发送原始内存数据。那么衡量我们案例的吞吐量的正确方法是什么?目前我们只是像这样用 gettimeofday 包装发送代码:
int total_sent = 0, bytes_sent = 0;
gettimeofday(&t0, 0);
for (total_sent = 0; total_sent < data_size;) {
bytes_sent = write(conn_fd, buf + total_sent, data_size - total_sent);
if (bytes_sent == -1)
break;
total_sent += bytes_sent;
}
gettimeofday(&t1, 0);
unsigned long elapsed_us = (t1.tv_sec - t0.tv_sec) * 1000000 + t1.tv_usec - t0.tv_usec;
double elapsed_s = (double)elapsed_us / 1000000;
printf("Throughput: %f Mbit/s\n", img_size * 8 / elapsed_s / 1000000);
printf("Total bytes sent: %d\n", total_sent);
这是衡量吞吐量的正确方法吗?
2.是否可以通过两个以太网端口增加吞吐量?比如将原始数据分成两部分并通过两个端口发送。
3.在我们的案例中增加吞吐量的最佳方法是什么?我们希望达到的最大吞吐量是 1024MBit/s。
最佳答案
几点评论:gettimeofday() 系统调用的开销会影响您的测量结果。
确保以太网端口驱动程序启用了 NAPI。
如果您想要最大吞吐量,请尝试实现零拷贝。如果您坚持使用 TCP,也许您可以使用 vmsplice() 做一些事情(参见:vmsplice() and TCP)。
为获得最佳结果,转储 TCP,使用带 PACKET_MMAP 选项的数据包套接字 (http://blog.superpat.com/2010/06/01/zero-copy-in-linux-with-sendfile-and-splice/) 并实现可靠的 UDP 协议(protocol)(例如 https://bitsecant.googlecode.com/svn-history/r8/trunk/src/net/rudp/ReliableServerSocket.java 用于 Win 7 对等体的 JAVA 实现)。
祝你好运
关于c - 测量和提高千兆以太网吞吐量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27540014/