c++ - C++ 中的 MSD 基数排序(字典顺序)

标签 c++ algorithm sorting c++11 recursion

感谢阅读这篇文章。

我想创建一个 MSD 基数排序,它应该按字典(字母)顺序对无符号整数 vector 进行排序。

给定“1、3、32、1254、3、165、50000、11、213”

排序为“1、11、1254、165、213、3、3、32、50000”

由于我认为我应该递归地执行此操作,因此我 try catch 最高数字并使用所有数字的下一个数字递归调用该函数。但是,我刚刚意识到我的逻辑是错误的,因为这将按常规数字顺序排序,因为我用相同的数字从最高数字开始迭代所有数字(例如,第 5 个数字,对于没有更多数字的数字可能为 0超过 5 位数)。所以我放弃了这个算法,但想不出新的想法。

因为这可以处理任何数字,所以它应该递归操作。我现在有一些想法,但它们似乎没有用:

  1. 因为这类似于字母顺序,我可以使用 std::to_string() 将整数更改为字符串,并使用 std::sort() ,但我认为这不是一个好的选择,因为它不再寻求算法结果,而且我不知道如何将字符串改回无符号整数。
  2. 我想通过重复除以 10 直到结果小于 10 来找到最大的数字,然后对每个数字按这个数字排序,但它不起作用,因为数字的数字不同,我不能递归地这样做我已经通过划分丢失了大部分数据。我想我仍然坚持数字排序模型。当我们无法确定固定数字或任何可能的比较点以实现递归排序时,我真的没有看到我们可以使递归成为可能的步骤。

对于这种不同类型的数字排序,您有什么实现想法吗?

最佳答案

#include <vector>
#include <algorithm>
#include <iostream>
#include <array>
#include <numeric>
#include <cassert>

namespace details
{
    const int kNoDigit = -1;
    int ExtractDigit(int i, int pos) {
        const int digitsCount = log10(i) + 1;
        if (pos > digitsCount) return kNoDigit;
        return (int)(i / pow(10, digitsCount - pos)) % 10;
    }

    // For pos equals to 2 and {10 20 1} -> {0, 1, 3, 3, ...},
    // 1 ends with empty digit in the second digit and 2 ends with 0
    template <class It>
    auto CountingSort(It begin, It end, int pos) {
        std::array<int, 12> bins;
        std::fill(bins.begin(), bins.end(), 0);
        for (auto it = begin; it < end; ++it) {
            const int digit = ExtractDigit(*it, pos);
            ++bins[digit + 1];
        }
        std::partial_sum(bins.cbegin(), bins.cend(), bins.begin());
        std::move(bins.cbegin(), bins.cend() - 1, bins.begin() + 1);
        return bins;
    }

    template <class It>
    void MsdRadixInternal(It begin, It end, int pos) {
        const auto bins = CountingSort(begin, end, pos);
        // We finish when i is 1, because the last part ends up sorted anyway
        for (int i = 10; i > 0; --i) {
            const int digit = i - 1;
            const auto local_begin = begin + bins[i];
            const auto local_end = begin + bins[i + 1];
            if (local_begin == begin) break;
            if (std::distance(local_begin, local_end) > 0) {
                auto crsrForward = begin;
                auto crsrBackward = local_end - 1;
                while (crsrForward < crsrBackward) {
                    assert(crsrForward < local_begin && local_begin <= crsrBackward);
                    while (ExtractDigit(*crsrBackward, pos) == digit) --crsrBackward;
                    while (ExtractDigit(*crsrForward, pos) != digit) ++crsrForward;
                    if (crsrForward < local_begin) {
                        std::swap(*crsrBackward, *crsrForward);
                    }
                    ++crsrForward;
                }
            }
        }
        // Start from 1 as we don't want to sort numbers wich are out of digits in pos already
        for (int i = 1; i < 11; ++i) {
            if (bins[i + 1] - bins[i] > 1)
                MsdRadixInternal(begin + bins[i], begin + bins[i + 1], pos + 1);
        }
    }
}

template <class It>
void MsdRadix(It begin, It end) {
    details::MsdRadixInternal(begin, end, 1);
}

int main()
{
    std::vector<int> v = { 1, 3, 32, 1254, 3, 165, 50000, 11, 213 };
    MsdRadix(v.begin(), v.end());
    std::copy(v.begin(), v.end(), std::ostream_iterator<int>(std::cout, " "));
    return 0;
}

1 11 1254 165 213 3 3 32 50000

此实现并非以效率为目标,例如可以以更快的方式实现提取数字。

关于c++ - C++ 中的 MSD 基数排序(字典顺序),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53013516/

相关文章:

algorithm - 排序算法的性能分析

algorithm - 生成数据的最有效排序算法

C++ Arduino,一次运行两个循环?

c++ - MFC 应用程序中的 RSS 提要和程序更新

c++ - 在 C++ 中使用二维 vector 时出错

python - 查找数字的算法

c - 在一个函数中对 5 个数组进行排序

c++ - 创建对整数数组指针的 vector<int> 引用 (C++)

algorithm - 线性时间算法的总和是线性时间?

java - 使用 Java Stream 查找最大公约数,无需递归 while/for 循环