c# - 为什么这个 Base36 随机字符串不使用 RandomNumberGenerator 随机分布字符

标签 c# random base36

我正在尝试使用 C# 生成随机 Base36 字符串。我使用的是 RandomNumberGenerator 而不是 Random,因为代码需要是线程安全的。我有以下代码设置:

private readonly RandomNumberGenerator _random = RandomNumberGenerator.Create(); 

private string GenerateBase36Token(int length)
{
    string token = string.Empty;

    for (int i = 0; i < length; i++)
    {
        byte[] bytes = new byte[100];
        _random.GetBytes(bytes);
        token += ToBase36String(bytes)[0];
    }

    return token;
}

private string ToBase36String(byte[] toConvert)
{
    const string alphabet = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
    BigInteger dividend = new BigInteger(toConvert);
    StringBuilder builder = new StringBuilder();

    while (dividend != 0)
    {
        BigInteger remainder;
        dividend = BigInteger.DivRem(dividend, alphabet.Length, out remainder);
        builder.Insert(0, alphabet[Math.Abs((int)remainder)]);
    }

    return builder.ToString();
}

这似乎有效,但是从结果来看,很明显字符串没有均匀地分布潜在字符。有很多重复的字母和很少出现的数字。

问题只是取随机字符串的第一个字符还是字符串的构建方式存在问题?

最佳答案

如果您想坚持这种方法,我认为您应该使用模数而不是 DivRem。我这样做的动机是,如果你不断地将一个大数除以一个较小的数,你会遇到这样的情况:原始数相对较高还是较低(即 100,相对于一个大数) )。

例如,将这些数字作为输入(仅作为示例): 36.000.000 作为您的股息,以及 10 作为你的除数。 ToBase36String 中的 while 循环将如下所示:

迭代 1: 股息:36.000.000 余数:3.600.000

迭代 2: 股息:3.600.000 剩余:360.000

迭代 3: 股息:360.000 剩余:36.000

迭代 4: 股息:36.000 余数:3.600

迭代 5: 股息:3.600 余数:360

迭代 6: 股息:360 余数:36

迭代 7: 股息:36 余数:3

如果我们一开始就将 38.000.000 或 31.000.000 作为被除数,那就没有关系了,因为由于整数除法的工作原理,迭代 7 无论如何都会得到 3 的余数。

我想要表达的一点是,对我来说似乎没有必要为每个 base36 字符随机生成一个大于 36 的数字,并且您的GenerateBase36Token 方法为每个字符创建 100 字节的数据。

另外,我想知道为什么您需要一个 Base36 字符,而 Base64 是一种广泛使用和接受的数据编码格式。

tl;dr:一个快速而简单的解决方案可能是只生成一个字节的随机数据,并使用模运算符而不是 DivRem 方法。

编辑:更新了您的代码

private readonly RandomNumberGenerator _random = RandomNumberGenerator.Create(); 

private string GenerateBase36Token(int length)
{
    string token = string.Empty;

    for (int i = 0; i < length; i++)
    {
        byte[] bytes = new byte[1]; //edited byte array size
        _random.GetBytes(bytes);
        token += ToBase36String(bytes)[0];
    }

    return token;
}

private string ToBase36String(byte[] toConvert)
{
    const string alphabet = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789";
    int dividend = (int)toConvert[0];
    StringBuilder builder = new StringBuilder();

    int remainder;
    remainder = dividend % alphabet.Length; //edited DivRem method usage to modulo operator usage
    builder.Insert(0, alphabet[remainder]);

    return builder.ToString();
}

关于c# - 为什么这个 Base36 随机字符串不使用 RandomNumberGenerator 随机分布字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56128861/

相关文章:

c - C 中的随机图

Java:将 byte[] 转换为 base36 字符串

C++不随机化

c# - .NET 6 Blazor 服务器 API 调用 - 将嵌套 JSON 对象反序列化为 C# 对象

C# 相交字符串列表的最快方法

C#和MySql插入数据错误

c - 为什么 C 不能正确计算模数,但结果却是正确的?

java - 如果将 Java Long 转换为另一个基数,如何从转换后的 String 取回它?

javascript - 如何以与 JavaScript 的 .toString(36) 相同的方式在 C# 中将 float 转换为 Base36

c# - 如何使用 WinAPI/C# 获取监视器/显示设备名称