C++ unordered_map<string, ...> 不构造字符串的查找

标签 c++ string c++11 unordered-map

我有 C++ 代码可以调查一个大字符串并匹配很多子字符串。我尽可能避免构造 std::strings,方法是像这样编码子字符串:

char* buffer, size_t bufferSize

然而,在某些时候,我想在其中一个中查找子字符串:

std::unordered_map<std::string, Info> stringToInfo = {...

所以,为了做到这一点,我去:

stringToInfo.find(std::string(buffer, bufferSize))

构造一个 std::string 的唯一目的是查找。

我觉得我可以在这里做一个优化,通过...将 unordered_map 的键类型更改为某种临时字符串冒名顶替者,一个像这样的类...

class SubString
{
    char* buffer;
    size_t bufferSize;

    // ...
};

... 执行与 std::string 相同的逻辑来散列和比较,但在它被销毁时不会释放其缓冲区。

所以,我的问题是:是否有办法让标准类执行此操作,还是我自己编写此类?

最佳答案

您要执行的操作称为异构查找。自 C++14 起,它就支持 std::map::find std::set::find (注意函数的版本 (3) 和 (4),它们以查找值类型为模板)。对于无序容器来说更复杂,因为它们需要被告知或找到所有键类型的散列函数,这些散列函数将为相同的文本生成相同的散列值。有一项关于 future 标准的提案正在考虑中:http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2018/p0919r0.html

与此同时,您可以使用另一个已经支持异构查找的库,例如 boost::unordered_map::find .

如果要坚持std::unordered_map ,您可以通过存储 std::string 来避免创建如此多的临时字符串加入你的unordered_map您可以重新分配值,然后传递 stringfind .您可以将其封装在自定义容器类中。

另一种方法是编写一个自定义类用作您的无序容器键:

struct CharPtrOrString
{
    const char* p_;
    std::string s_;

    explicit CharPtrOrString(const char* p) : p_{p} { }
    CharPtrOrString(std::string s) : p_{nullptr}, s_{std::move(s)} { }

    bool operator==(const CharPtrOrString& x) const
    {
        return p_ ? x.p_ ? std::strcmp(p_, x.p_) == 0
                         : p_ == x.s_
                  : x.p_ ? s_ == x.p_
                         : s_ == x.s_;
    }

    struct Hash
    {
        size_t operator()(const CharPtrOrString& x) const
        {
            std::string_view sv{x.p_ ? x.p_ : x.s_.c_str()};
            return std::hash<std::string_view>()(sv);
        } 
    };
};

然后你可以构造CharPtrOrString来自 std::string s 用于无序容器键,但可以从你的 const char* 中廉价地构建一个每次你打电话find .注意 operator==上面必须计算出你做了什么(使用的惯例是如果指针的 nullptrstd::string 成员正在使用中)所以它比较正在使用的成员。哈希函数必须确保 std::string具有特定文本值的哈希值将产生与 const char* 相同的哈希值(默认情况下,GCC 7.3 和/或 Clang 6 不会 - 我同时使用这两者,记得其中一个有问题,但不是哪个)。

关于C++ unordered_map<string, ...> 不构造字符串的查找,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49709548/

相关文章:

c++ - 如何从 QProcess 获取错误代码?

python - 如何使用 __str__ 方法打印列表?

c - 为什么我会在这里出现段错误

c++ - 在不显式指定其余参数的情况下设置默认模板非类型参数

c++ - now() 调用标准计时时钟的性能保证?

c++ - 初始化成员结构的正确方法

c++ - 需要帮助理解从 B.Stroustrup 的新书中摘录的这段文字

c++ - copy-and-swap 习语和迭代器

java - 在 C/C++/Java 中查找 USB 设备的信息

java - 是否有一个 java 库可以将描述时间度量的字符串(例如 "1d 1m 1s")转换为毫秒?