c++ - 在 C++ 中,关于位移和转换数据类型

标签 c++ sockets bit-manipulation opcode

我最近在 Stack Overflow 上问了一个问题,关于如何将我的数据从 16 位整数后跟不确定数量的 void*-cast 内存转换为 std::vector of unsigned chars,以便使用已知的套接字库作为 NetLink,它使用签名如下所示的函数来发送原始数据:

void rawSend(const vector<unsigned char>* data);

(作为引用,这里是那个问题: Casting an unsigned int + a string to an unsigned char vector )

问题已成功回答,我感谢回答的人。 Mike DeSimone 给出了一个 send_message() 函数示例,该函数将数据转换为 NetLink 接受的格式(std::vector),如下所示:
void send_message(NLSocket* socket, uint16_t opcode, const void* rawData, size_t rawDataSize)
{
    vector<unsigned char> buffer;
    buffer.reserve(sizeof(uint16_t) + rawDataSize);
    buffer.push_back(opcode >> 8);
    buffer.push_back(opcode & 0xFF);
    const unsigned char* base(reinterpret_cast<const unsigned char*>(rawData));
    buffer.insert(buffer.end(), base, base + rawDataSize);
    socket->rawSend(&buffer);
}

这看起来正是我所需要的,所以我开始编写一个随附的 receive_message() 函数......

......但我很尴尬地说我并不完全理解所有的位移和诸如此类的东西,所以我在这里遇到了一堵墙。在我过去近十年编写的所有代码中,我的大部分代码都是使用高级语言编写的,而我的其余代码从未真正调用过低级内存操作。

回到编写 receive_message() 函数的主题,正如您所想象的,我的出发点是 NetLink 的 rawRead() 函数,其签名如下所示:
vector<unsigned char>* rawRead(unsigned bufferSize = DEFAULT_BUFFER_SIZE, string* hostFrom = NULL);

看起来我的代码将以这样的方式开始:
void receive_message(NLSocket* socket, uint16_t* opcode, const void** rawData)
{
    std::vector<unsigned char, std::allocator<unsigned char>>* buffer = socket->rawRead();
    std::allocator<unsigned char> allocator = buffer->get_allocator(); // do I even need this allocator?  I saw that one is returned as part of the above object, but...
    // ...
}

在第一次调用 rawRead() 之后,看来我需要遍历 vector ,从中检索数据并反转位移操作,然后将数据返回到 *rawData 和 *opcode。同样,我对 bitshifting 不是很熟悉(我做了一些谷歌搜索来理解语法,但我不明白为什么上面的 send_message() 代码需要移位),所以我对下一步感到茫然这里。

有人可以帮助我理解如何编写这个随附的 receive_message() 函数吗?作为奖励,如果有人可以帮助解释原始代码,以便我将来知道它是如何工作的(特别是,在这种情况下转换是如何工作的以及为什么有必要),那将有助于加深我对 future 的理解。

提前致谢!

最佳答案

库的函数签名……

    void rawSend( const vector<unsigned char>* data );

强制你建立一个 std::vector的数据,这实质上意味着它会造成不必要的低效率。要求客户端代码构建 std::vector 没有优势。 .设计它的人不知道他们在做什么,不使用他们的软件是明智的。

库函数签名...
    vector<unsigned char>* rawRead(unsigned bufferSize = DEFAULT_BUFFER_SIZE, string* hostFrom = NULL);

更糟糕的是:它不仅不必要地要求您构建 std::string如果你想指定一个“hostFrom”(不管它真正意味着什么),但它不必要地要求你释放结果 vector .至少如果函数结果类型有任何意义。当然,可能没有。

您不应该使用具有如此令人厌恶的函数签名的库。可能任何随机挑选的图书馆都会好得多。即,更容易使用。

现有的使用代码如何...
void send_message(NLSocket* socket, uint16_t opcode, const void* rawData, size_t rawDataSize)
{
    vector<unsigned char> buffer;
    buffer.reserve(sizeof(uint16_t) + rawDataSize);
    buffer.push_back(opcode >> 8);
    buffer.push_back(opcode & 0xFF);
    const unsigned char* base(reinterpret_cast<const unsigned char*>(rawData));
    buffer.insert(buffer.end(), base, base + rawDataSize);
    socket->rawSend(&buffer);
}

作品:
  • reserve call 是一种过早优化的情况。它试图使 vector只做一个单一的缓冲区分配(此时执行)而不是两个或更多。更好地解决构建 vector 明显效率低下的问题, 是使用一个更理智的库。
  • buffer.push_back(opcode >> 8)放置(假定)16 位数量的高 8 位 opcode , 在 vector 的开头。放置高的部分,最重要的部分,首先,被称为 大端格式。另一端的阅读代码必须采用大端格式。同样,如果这个发送代码使用了 小端格式,那么读取代码将不得不采用小端格式。所以,这只是一个数据格式的决定,但鉴于决定,两端的代码必须遵守它。
  • buffer.push_back(opcode & 0xFF)调用放置 opcode 的低 8 位在高位之后,对于大端是正确的。
  • const unsigned char* base(reinterpret_cast<const unsigned char*>(rawData))声明只是命名一个适当类型的指向你的数据的指针,称之为 base .型号const unsigned char*是合适的,因为它允许字节级别 地址算术 .原始形式参数类型 const void*不承认地址算术。
  • buffer.insert(buffer.end(), base, base + rawDataSize)将数据添加到 vector 中。表达式 base + rawDataSize是先前声明启用的地址算法。
  • socket->rawSend(&buffer)是最后一次调用 SillyLibrary 的 rawSend方法。


  • 如何结束对 SillyLibrary 的调用 rawRead功能。

    首先,为字节数据类型定义一个名称(命名总是一个好主意):
    typedef unsigned char Byte;
    typedef ptrdiff_t Size;
    

    请参阅有关如何解除分配/销毁/删除(如有必要) SillyLibrary 函数结果的文档:
    void deleteSillyLibVector( vector<Byte> const* p )
    {
        // perhaps just "delete p", but it depends on the SillyLibrary
    }
    

    现在,对于具有 std::vector 的发送操作参与只是一种痛苦。对于接收操作,则相反。创建一个动态数组并将其作为函数结果安全有效地传递,正是 std::vector 的那种事情。是专为。

    然而,发送操作只是一次调用。

    对于接收操作,根据 SillyLibrary 的设计,您可能需要循环执行一定数量的接收调用,直到您收到所有数据。您没有提供足够的信息来执行此操作。但是下面的代码显示了您的循环代码可以调用的底层读取,在 vector 中累积数据。 :
    Size receive_append( NLSocket& socket, vector<Byte>& data )
    {
        vector<Byte> const* const result = socket.raw_read();
    
        if( result == 0 )
        {
            return 0;
        }
    
        struct ScopeGuard
        {
            vector<Byte>* pDoomed;
            explicit ScopeGuard( vector<Byte>* p ): pDoomed( p ) {}
            ~ScopeGuard() { deleteSillyLibVector( pDoomed ); }
        };
    
        Size const nBytesRead = result->size();
        ScopeGuard cleanup( result );
    
        data.insert( data.end(), result->begin(), result->end() );
        return nBytesRead;
    }
    

    请注意使用析构函数进行清理,这使得异常更安全。在这种特殊情况下,唯一可能的异常是 std::bad_alloc ,无论如何这是非常致命的。但是,为了异常安全,使用析构函数进行清理的一般技术非常值得了解并作为理所当然地使用(尽管通常不必定义任何新类,但是在处理 SillyLibrary 类时)可能必须这样做)。

    最后,当循环代码确定所有数据都在手头时,它可以解释 vector 中的数据。 .我把它留作练习,尽管这主要是你要求的。那是因为我已经在这里写了几乎整篇文章。

    免责声明:即用代码。

    干杯 & hth.,

    关于c++ - 在 C++ 中,关于位移和转换数据类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7775599/

    相关文章:

    c++ - 多个交错 QAbstractItemModel::beginInsertRows()/beginRemoveRows() 后跟一个 endInsertRow()/endRemoveRow() 调用?

    c++ - 什么是用于 C++ 项目的良好交互式语言解析器?

    c++ - ShGetFolderPath wchar_t 不会为 x64 编译

    javascript - Socket.io - 实现用于私有(private)消息传递的用户套接字关联映射

    java - 在 Java 中从字节中查找位值的问题

    c++ - 范围与变量的生命周期

    java - Android TCP 连接到 C 服务器 : String transferred is noisy

    sockets - 如何将 UDP 消息发送到环回地址,然后从中读取?

    c - 使用给定的按位运算符来重现函数

    php - 整数的基本混淆算法