c++ - C++ 中的 reduce 函数(用于许多集合 union )

标签 c++ stl set reduce

我正在尝试做的事情: 我在使用 STL 的 C++ 中有一个简单的集合 union 函数,我试图将它包装在一个函数中,该函数可以让我执行 STL 数据结构中包含的任意多个集合的 union (例如 std::liststd::vectorstd::forward_list 、... ).

我是如何尝试做到的: 首先,我的简单集合并集:

#include <algorithm>
template <typename set_type>
set_type sunion(const set_type & lhs, const set_type & rhs)
{
  set_type result;
  std::set_union( lhs.begin(), lhs.end(), rhs.begin(), rhs.end(), std::inserter(result, result.end()) );
  return result;
}

其中 set_type 定义了一些 STL std::set<T> ,例如std::set<int>

多次注意到我最终需要对集合的迭代器执行多个 union (在 Python 中,这将是我的 reduce 函数的 sunionset_type s 的某个可迭代对象上)。例如,我可能有

std::vector<std::set<int> > all_sets;

std::list<std::set<int> > all_sets;

等,我想获得 all_sets 中所有集合的并集。我正在尝试为此实现一个简单的 reduce,它本质上做了一个(更快、更优雅、非复制)版本:

sunion(... sunion( sunion( all_sets.begin(), all_sets.begin()+1 ), all_sets.begin()+2 ) , ... )

本质上,为了快速执行此操作,我只想声明一个 set_type result,然后遍历 all_sets 并将 all_sets 中每个集合中的值插入到结果对象中:

template <typename set_type>
set_type sunion_over_iterator_range(const std::iterator<std::forward_iterator_tag, set_type> & begin, const std::iterator<std::forward_iterator_tag, set_type> & end)
{
  set_type result;
  for (std::iterator<std::forward_iterator_tag, set_type> iter = begin; iter != end; iter++)
    {
      insert_all(result, *iter);
    }
  return result;
}

定义 insert_all 的地方:

// |= operator; faster than making a copy and performing union
template <typename set_type>
void insert_all(set_type & lhs, const set_type & rhs)
{
  for (typename set_type::iterator iter = rhs.begin(); iter != rhs.end(); iter++)
    {
      lhs.insert(*iter);
    }
}

它为什么不起作用: 不幸的是,我的 sunion_over_iterator_range(...) 不适用于类型为 std::vector<set_type>::begin(), std::vector<set_type>::end() 的参数 std::vector<set_type>::iterator 。我认为 std::vector<T>::iterator 返回 iterator<random_access_iterator_tag, T> 。一个

由于迭代器类型不兼容导致编译失败后,我查看了 STL vector 源(位于 /usr/include/c++/4.6/bits/STL_vector.h for g++ 4.6 & Ubuntu 11.10),并且惊讶地看到 vector<T>::iterator 的 typedef 是 typedef __gnu_cxx::__normal_iterator<pointer, vector> iterator; 。我以为是 ForwardIterator was a subtype of RandomAccessIterator, and so should be fine ,但显然我错了,否则我不会在这里。

由于我的经验不足而激起您的挫败感,我既感激又惭愧: 如果我表现出我的无知,我深表歉意——我正在努力学习成为一个更好的面向对象的程序员(过去我只是简单地用 C 风格代码破解了所有东西)。

我尽力了,教练!如果没有您的代码忍者洞察力,请帮助我,让世界远离我会产生的错误代码......

最佳答案

这是一个非常幼稚的方法:

std::set<T> result;
std::vector<std::set<T>> all_sets;

for (std::set<T> & s : all_sets)
{
    result.insert(std::make_move_iterator(s.begin()),
                  std::make_move_iterator(s.end()));
}

这会使源集中的元素无效,尽管它实际上并没有移动元素节点。如果您想完整保留源集,只需删除 make_move_iterator

不幸的是 std::set 没有接口(interface)可以让你以不重新分配内部树节点的方式“拼接”两个集合,所以这或多或少和你一样好可以得到。


这是一个可变模板方法:

template <typename RSet> void union(RSet &) { }

template <typename RSet, typename ASet, typename ...Rest>
void union(RSet & result, ASet const & a, Rest const &... r)
{
    a.insert(a.begin(), a.end());
    union(result, r...);
}

用法:

std::set<T> result
union(result, s1, s2, s3, s4);

(类似的移动优化在这里是可行的;您甚至可以添加一些分支,这些分支将从不可变对象(immutable对象)复制但从可变对象或仅从右值移动,如果您愿意的话。)


这是一个使用 std::accumulate 的版本:

std::set<T> result =
   std::accumulate(all_sets.begin(), all_sets.end(), std::set<T>(),
                   [](std::set<T> & s, std::set<T> const & t)
                     { s.insert(t.begin(), t.end()); return s; }    );

不过,这个版本似乎非常依赖于返回值优化,因此您可能想将它与这个经过改进且相当丑陋的版本进行比较:

std::set<T> result;
std::accumulate(all_sets.begin(), all_sets.end(), 0,
                [&result](int, std::set<T> const & t)
                { result.insert(t.begin(), t.end()); return 0; } );

关于c++ - C++ 中的 reduce 函数(用于许多集合 union ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9898095/

相关文章:

c++ - 对使用 STL 并行算法的用户有何限制?

c++ - STL(标准模板库)中使用的设计模式

python - 集合列表的减法

jenkins - 读取控制台日志行/值后设置 Jenkins 变量 -- 或者 -- 使用 Jenkins 调用的脚本/命令使用的变量

c++ - 我如何在必须返回类模板的函数指针上使用 C++ 中的 typedef?

c++ - Dijkstra 算法未在邻接矩阵中找到路径

c++ - std::search 提取当前迭代器并使用 std::advance 向前移动迭代器

c++ - double 或浮点比较

c++ - Python 比 C++ 快?这是怎么发生的?

c++ - 修改集合元素