我正在尝试做的事情:
我在使用 STL 的 C++ 中有一个简单的集合 union 函数,我试图将它包装在一个函数中,该函数可以让我执行 STL 数据结构中包含的任意多个集合的 union (例如 std::list
、 std::vector
、 std::forward_list
、... ).
我是如何尝试做到的: 首先,我的简单集合并集:
#include <algorithm>
template <typename set_type>
set_type sunion(const set_type & lhs, const set_type & rhs)
{
set_type result;
std::set_union( lhs.begin(), lhs.end(), rhs.begin(), rhs.end(), std::inserter(result, result.end()) );
return result;
}
其中 set_type
定义了一些 STL std::set<T>
,例如std::set<int>
。
多次注意到我最终需要对集合的迭代器执行多个 union (在 Python
中,这将是我的 reduce
函数的 sunion
在 set_type
s 的某个可迭代对象上)。例如,我可能有
std::vector<std::set<int> > all_sets;
或
std::list<std::set<int> > all_sets;
等,我想获得 all_sets
中所有集合的并集。我正在尝试为此实现一个简单的 reduce,它本质上做了一个(更快、更优雅、非复制)版本:
sunion(... sunion( sunion( all_sets.begin(), all_sets.begin()+1 ), all_sets.begin()+2 ) , ... )
本质上,为了快速执行此操作,我只想声明一个 set_type result
,然后遍历 all_sets
并将 all_sets
中每个集合中的值插入到结果对象中:
template <typename set_type>
set_type sunion_over_iterator_range(const std::iterator<std::forward_iterator_tag, set_type> & begin, const std::iterator<std::forward_iterator_tag, set_type> & end)
{
set_type result;
for (std::iterator<std::forward_iterator_tag, set_type> iter = begin; iter != end; iter++)
{
insert_all(result, *iter);
}
return result;
}
定义 insert_all
的地方:
// |= operator; faster than making a copy and performing union
template <typename set_type>
void insert_all(set_type & lhs, const set_type & rhs)
{
for (typename set_type::iterator iter = rhs.begin(); iter != rhs.end(); iter++)
{
lhs.insert(*iter);
}
}
它为什么不起作用:
不幸的是,我的 sunion_over_iterator_range(...)
不适用于类型为 std::vector<set_type>::begin(), std::vector<set_type>::end()
的参数 std::vector<set_type>::iterator
。我认为 std::vector<T>::iterator
返回 iterator<random_access_iterator_tag, T>
。一个
由于迭代器类型不兼容导致编译失败后,我查看了 STL vector 源(位于 /usr/include/c++/4.6/bits/STL_vector.h for g++ 4.6 & Ubuntu 11.10),并且惊讶地看到 vector<T>::iterator
的 typedef 是 typedef __gnu_cxx::__normal_iterator<pointer, vector> iterator;
。我以为是 ForwardIterator was a subtype of RandomAccessIterator, and so should be fine ,但显然我错了,否则我不会在这里。
由于我的经验不足而激起您的挫败感,我既感激又惭愧: 如果我表现出我的无知,我深表歉意——我正在努力学习成为一个更好的面向对象的程序员(过去我只是简单地用 C 风格代码破解了所有东西)。
我尽力了,教练!如果没有您的代码忍者洞察力,请帮助我,让世界远离我会产生的错误代码......
最佳答案
这是一个非常幼稚的方法:
std::set<T> result;
std::vector<std::set<T>> all_sets;
for (std::set<T> & s : all_sets)
{
result.insert(std::make_move_iterator(s.begin()),
std::make_move_iterator(s.end()));
}
这会使源集中的元素无效,尽管它实际上并没有移动元素节点。如果您想完整保留源集,只需删除 make_move_iterator
。
不幸的是 std::set
没有接口(interface)可以让你以不重新分配内部树节点的方式“拼接”两个集合,所以这或多或少和你一样好可以得到。
这是一个可变模板方法:
template <typename RSet> void union(RSet &) { }
template <typename RSet, typename ASet, typename ...Rest>
void union(RSet & result, ASet const & a, Rest const &... r)
{
a.insert(a.begin(), a.end());
union(result, r...);
}
用法:
std::set<T> result
union(result, s1, s2, s3, s4);
(类似的移动优化在这里是可行的;您甚至可以添加一些分支,这些分支将从不可变对象(immutable对象)复制但从可变对象或仅从右值移动,如果您愿意的话。)
这是一个使用 std::accumulate
的版本:
std::set<T> result =
std::accumulate(all_sets.begin(), all_sets.end(), std::set<T>(),
[](std::set<T> & s, std::set<T> const & t)
{ s.insert(t.begin(), t.end()); return s; } );
不过,这个版本似乎非常依赖于返回值优化,因此您可能想将它与这个经过改进且相当丑陋的版本进行比较:
std::set<T> result;
std::accumulate(all_sets.begin(), all_sets.end(), 0,
[&result](int, std::set<T> const & t)
{ result.insert(t.begin(), t.end()); return 0; } );
关于c++ - C++ 中的 reduce 函数(用于许多集合 union ),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9898095/