php - PHP-获取数据包长度

标签 php sockets udp

我目前正在处理PHP中的套接字和数据包,并且不知道从哪里开始获取数据包的长度。我从GitHub存储库尝试了此操作(不记得是哪个):

    private function get_packet_length($socket) {
        $a = 0;
        $b = 0;
        while(true) {
            $c = socket_read($socket, 1);
            if (!$c) {
                return 0;
            }
            $c = ord($c);
            $a |= ($c & 0x7F) << $b++ * 7;
            if ($b > 5) {
                return false;
            }
            if (($c & 0x80) != 128) {
                break;
            }
        }
        return $a;
    }

有人知道为什么这行不通吗?我得到int(1)

编辑
private function get_packet_length($socket) {
        $a = 0;
        $b = 0;
        while(true) {
            $c = socket_read($socket, 10240);
            if (!$c) {
                return 0;
            }
            $c = ord($c);
            $a .= strlen($c);
            if ($b > 5) {
                return false;
            }
            if (($c & 0x80) != 128) {
                break;
            }
        }
        return $a;
    }

输出:string(2) "01"

最佳答案

数据包没有固有的长度,即使从C获取此信息实际上也相对困难。这是因为在用户层,套接字数据没有以数据包的形式表示。 (UDP表示为完整的有效载荷,但是在用户区中接收到的单个UDP有效载荷绝对有可能仍然代表多个数据包。)因此,这个问题并不是很正确,您真正应该问的是如何确定如何在套接字上可以读取许多字节。

那么,为什么您粘贴的代码没有告诉您呢?您应该真正理解该代码的作用,因为它很有趣。但是,由于它与您实际上可能感兴趣的信息有关,因此我将其留待以后使用。

不幸的是,PHP没有为您提供一种使用原始套接字FD调用ioctl(2)的方法。这将允许您在PHP-land中执行类似ioctl(sock, FIONREAD, &n)的操作来确定可读取的字节数。 (实际上,显然,如果您使用fopenfsockopen,则可以执行此操作,但是我想您没有。)las,这行不通。

幸运的是,有两个选项供您选择:

  • 使用非阻塞套接字。您可以在套接字流上调用socket_set_nonblock。完成此操作后,对socket_readsocket_write等的任何调用都将在非阻塞模式下进行。这意味着如果您这样做$data = socket_read($socket, 1024),并且少于1024个字节可用,将返回可用字节。 (如果没有可用数据,则返回的字节数可能为0。)
  • 使用socket_select对一系列套接字执行相同的操作。此函数通知您哪些套接字具有可读数据/处于可写状态/具有需要处理的错误。

  • 无论使用哪种版本,处理套接字未接收到足够数据的情况的一般方法都是实现超时。 socket_select为此提供了一个 native 接口(interface);使用非阻塞套接字手动执行此操作需要您记住已等待了多长时间,并在调用socket_read之间实现了 sleep 。如果您在一段时间(例如10秒)内未收到足够的数据,请关闭套接字,然后再进行处理。

    如果收到的数据超出预期,那是一个错误,然后关闭套接字,然后将其遗忘。

    您正在处理的协议(protocol)也很重要。因为您还没有说要处理什么协议(protocol),所以我无法借助指针来告诉您期望有多少数据。但是也许您正在实现自己的协议(protocol)很有趣。

    在这种情况下,您需要确定对在线数据进行编码的方法。因为您说的问题中使用的方法具有一些二进制技巧,所以我将做同样的事情。您可能需要将32位值pack放入字符串的开头。收到连接后,您等待前4个字节进入。一旦读取了这4个字节,就可以unpack该数据来确定需要读取多少字节。

    <?php
    $payload = "Have a nice day!\n";
    $len = strlen($payload) + 1; // + 1 for terminating NUL byte
    $packet = pack("Na", $len, $payload);
    socket_send($sock, $packet, $len + 4); // + 4 is length 
    ...
    

    然后,在服务器上
    <?php
    $r = socket_read($sock, 4);
    $la = unpack("N", $r);
    
    // Because we don't know how much to read until we get the first 4 bytes.
    // Obviously this is a DoS vector for someone to hold the connection open,
    // so you will likely want to use socket_select to get that first bit of
    // data. That's an exercise for you.
    socket_set_nonblock($sock);
    $len = $la[1];
    $time = 0;
    $payload = "";
    while ($len > 0 && $time < 10) { 
        $data = socket_read($sock, $la[1]);
        $tlen = strlen($data);
        $payload .= $data;
        $len -= $tlen;
        if ($len == 0) { 
            break;
        }
        sleep(1); // Feel free to usleep.
        $time++;
     }
    

    N.B.我在确保正确编码打包/解压缩数据后没有测试此代码,因此不确定是否可以逐字使用它。将其视为体系结构伪代码。

    其他协议(protocol)具有其他长度编码方式。例如,在通常情况下,HTTP使用Content-Length。

    您的示例代码

    在先前的编辑中,我只是通过查看第一个字节来获取长度来解决这个问题。我回过头来回答这个问题,因为我看到了反对意见,并且关于数据包的某些措辞困扰着我。我也从快速浏览该代码中就得出结论,这是非常错误的。

    该代码从套接字读取各个字节,以尝试获取可变长度的剩余有效负载。 (我想知道这是来自ZeroMQ的 repo 代码还是Apple推送通知之类的代码。)无论如何,看起来该代码确实有些奇怪的东西,但是实际上是什么呢?
    private function get_packet_length($socket) {
        $a = 0;
        $b = 0;
        while(true) {
            /* Read next single byte off of the socket */
            $c = socket_read($socket, 1);
            if (!$c) {
                return 0;
            }
    
            /* Use integer value of the byte instead of the character value */
            $c = ord($c);
    
            /*
             * Get the first 7 bits of $c. Since $c represents an integer value
             * of a single byte, its maximum range is [0, 2^8). When we use only
             * 7 bits, the range is constrained to [0, 2^7), or 0 - 127. This
             * means we are using the 8th bit as a flag of some kind -- more on
             * this momentarily.
             *
             * The next bit executed is ($b++ * 7), since multiplication has
             * higher precedence than a left shift. On the first iteration, we
             * shift by 0 bits, the second we shift 7 bits, the third we shift
             * 14 bits, etc. This means that we're incrementally building an
             * integer value byte by byte. We'll take a look at how this works
             * out on real byte sequences in a sec.
             */
            $a |= ($c & 0x7F) << $b++ * 7;
    
            /*
             * If we've tried to handle more than 5 bytes, this encoding doesn't
             * make sense.
             */
            if ($b > 5) {
                return false;
            }
    
            /*
             * If the top bit was 1, then we still have more bytes to read to
             * represent this number. Otherwise, we are done reading this
             * number.
             */
            if (($c & 0x80) != 128) {
                break;
            }
        }
        return $a;
    }
    

    因此,让我们考虑一下几个不同的字节流的含义:
    $stream = "\x01"; /* This is pretty obviously 1 */
    $stream = "\x81\x80\x80\x00";
        /* This is also 1, can you figure out why? */
    
    $stream = "\xff\x01"; /* You might think it 256, but this is 255 */
    $stream = "\x80\x82"; /* This is 256. */
    $stream = "\xff\xff\x01"; /* 32767 */
    $stream = "\x80\x80\x02"; /* 32768 */
    
    $stream = "\x0c\x00\x48\x65\x6c\x6c\x6f\x2c\x20\x77\x6f\x72\x6c\x64\x21"
        /*
         * A static value 13, a length terminator, and 13 bytes that happen 
         * to represent "Hello, world!".
         * This shows how such an encoding would be used in practice
         */
    

    如果您熟悉字节顺序,则可能会注意到这些值是以Little-endian编码传输的。这通常很奇怪(网络字节顺序为big-endian),但实际上并没有发送完整的整数值:我们正在发送可变长度的字节流。每个字节的编码可以帮助我们弄清楚长度是多少。但是,在不知道该代码实现什么协议(protocol)的情况下,这实际上可能是一个错误,导致该代码无法在具有不同字节序的计算机之间移植。

    重要的是要注意,这是字节流协议(protocol)的一部分,而不是获取任何长度的标准方法。实际上,许多二进制协议(protocol)并未定义为字节流协议(protocol)。这是因为字节流协议(protocol)通常根本不定义字节序(因为该字节流不需要)。因此,如果您在PPC或某些ARM处理器上运行此代码,它将无法正常工作。因此,我们说此代码不可移植。

    在处理字节流或通过网络发送原始二进制数据时,请始终确保定义数据的字节序。如果您不这样做,则您的协议(protocol)将创建不可移植的实现。另请参见Rob Pike的this great post,以获取有关字节顺序的更多信息,以及为什么在任何时候遇到问题时,您要么感到困惑,要么某人做错了事(例如,在未完全定义数字编码的情况下定义字节流协议(protocol))。

    关于php - PHP-获取数据包长度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27631009/

    相关文章:

    php - PHP 不工作时输出 MySQL 查询的单个结果

    php - 关于显示特殊字符的建议

    php - Laravel - 返回 SSH 输出

    java - 服务器客户端多线程

    iOS 客户端使用 socketrocket 连接到服务器导致 "Stream end encountered"

    c++ - 将我的服务器响应 char 数组转换为 wchar_t 数组是否是处理客户端收到的服务器消息的正确方法?

    python - 未使用 PYQT5 多播 UDP 接收数据报

    javascript - 宏伟的弹出窗口获得帖子父级的永久链接

    java - 获取数据报的IP地址 spring-integration

    java - 带有序列号的 UDP