java - 生成可验证的随机数 - Java

标签 java testing random

我正在尝试验证一个属性数据库(实际上是一个文件系统,但对于这个讨论,我想保持简单)。该数据库具有以下属性:

它可以有 1 个或 2 个主键,并且它们必须是整数。 列可以是字符串(允许非 ascii)、整数、长整数或日期时间

我想验证我要求此数据库存储的值是否正确存储了大量记录(> 500k 记录)。因此,为此,我想扩展一个工具来生成我以后可以轻松验证的数据。

所以基本上,假设这是示例模式:

pk1 (int - primary key)
pk2 (int - primary key)
s1 (string)
l1 (long)
i1 (int)

我想用这个工具生成 500k 条记录。然后,在任何给定时间,我都希望能够对给定记录进行健全性检查。我可能会执行一系列操作(比如备份,然后恢复数据库),然后“抽查”几条记录。所以我希望能够快速验证主键记录条目 (pk1 = 100, pk2 = 1) 是否有效。

为每一列生成值的最佳方法是什么,以便以后可以轻松验证它。这些值不必是完全随机的,但它们也不应频繁重复,因此某些压缩逻辑也可能会受到影响。

例如,假设该工具“以某种方式”为一行生成了以下值:

pk1 = 1000
pk2 = 1
s1 = "foobar"
l1 = 12345
i1 = 17

现在我执行了几个操作,我想在最后验证这一行没有损坏。我必须能够快速生成 s1、l1 和 i1 的预期值 - 给定 pk1=1000 和 pk2=1 - 以便可以非常快速地对其进行验证。

想法?

(由于我是新手,所以我无法回答我自己的问题,所以添加这个:) 好的,所以我必须采取可能的方法:

方法#1: 使用 HASH(tablename) ^ HASH(fieldname) ^ pk1 ^ pk2 作为种子。这样,我可以在验证时轻松计算每列的种子。另一方面,当为大量行生成数据时,这可能会很昂贵,因为种子需要每列计算一次。因此,对于上述架构,我将有 500k*3 个种子(以生成 500k 条记录)。

方法# 2(由 Philipp Wendler 提出): 每行生成一个种子,并将种子存储在该行的第一列中。如果第一列是 int 或 long,则按原样存储值。如果第一列是字符串,则将种子存储在前 x 个字节中,然后使用使用该种子生成的字符将其填充到所需的字符串长度。

我更喜欢方法 #2,因为每行只有一个种子 - 使数据生成速度比方法 #1 快一些。

最佳答案

您可以只生成任意随机数据,计算哈希码(例如 MD5,因为它不需要加密安全)并将哈希码与您的数据一起存储。您可以为散列码设置一个单独的列,或者例如您可以将其附加到任何字符串列。

为了验证,将存储的哈希码与该行中的其余数据分开,重新计算哈希码并比较它们是否相等。如果它们不匹配,则说明您的数据已被修改。

这假设您只想保护您的数据免受意外修改(而不是来自恶意攻击者)。

关于java - 生成可验证的随机数 - Java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9181861/

相关文章:

java - 我如何测试这个 rxJava 代码?

java - 将 Gradle 支持添加到 IntelliJ 项目的最佳方式

python - 按给定优先级获取随机元素

java - Spring3 依赖注入(inject)不适用于 mule

java - MigLayout 50% 宽度

testing - 是否有选项告诉 bazel 测试不要缓存输出

testing - Gradle + Robolectric + Espresso : can't run separately

.net - 用于测试的静态日期时间

assembly - 组装中的随机数

c++ - 使用 uniform_int_distribution 与模数运算有什么优势?