我有一个带有 type
属性的多维关联数组。它看起来像这样:
$data = array(
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "B"),
array( "name" => "SomeName", "type" => "B"),
array( "name" => "SomeName", "type" => "B"),
array( "name" => "SomeName", "type" => "C"),
array( "name" => "SomeName", "type" => "C")
);
我想重新排列它以使项目分布更均匀(如果可能,重复类型最少)。它应该看起来像这样:
array(
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "B"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "C"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "B"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "C"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "B")
);
到目前为止我尝试的是找到每种类型的计数和总数:
$count_a = 5;
$count_b = 3;
$count_c = 2;
$total = 10;
还有每种类型的比率:
$ratio_a = 0.5; //(5/10)
$ratio_b = 0.3; //(3/10)
$ratio_c = 0.2; //(2/10)
我只是被困在这里。我应该尝试用一个数字创建一个新属性 index
然后根据它进行排序吗?或者以某种方式使用模运算符?如果这样更容易,我还尝试将项目分成 3 个不同的数组。
最佳答案
这是一个尽可能避免重复模式的解决方案。
对于 AAAAABBBCC
它将生成 ABABABACAC
;
对于 AAAAABBBCCC
它将生成 ABCABABACAC
;
除了按类型计数排序外,它还以线性时间运行(它接受未排序的数据数组)。结果在 $distributed_data
中。解释见下文。
代码
$data = array(
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "A"),
array( "name" => "SomeName", "type" => "B"),
array( "name" => "SomeName", "type" => "B"),
);
$distributed_data = array();
$counts = array();
$size = sizeof($data);
// Count values
foreach ($data as $entry) {
$counts[$entry["type"]] = isset($counts[$entry["type"]]) ? $counts[$entry["type"]] + 1 : 1;
}
// Set counter
for ($i = 0; $i < $size; $i++) {
$data[$i]["count"] = $counts[$data[$i]["type"]];
}
// Sort by count
usort($data, function($entry1, $entry2) {
return $entry2["count"] <=> $entry1["count"];
});
// Generate the distributed array
$max_length = $data[0]["count"];
$rows = ceil($size / $max_length);
$last_row = ($size - 1) % $max_length + 1;
$row_cycle = $rows;
$row = 0;
$col = 0;
for ($i = 0; $i < $size; $i++) {
if ($i == $rows * $last_row) {
$row_cycle -= 1;
}
$distributed_data[$i] = $data[$row * $max_length + $col];
$row = ($row + 1) % $row_cycle;
if ($row == 0) {
$col++;
}
}
说明
首先,根据每种类型的重复次数对条目进行排序。例如。 CBBCAAB
变为 BBBAACC
。
然后想象一个表,其列数与最常出现的列一样多(例如,如果您有 AAAABBCC
,则最常出现的列将是 4,而该表将有 4 列)。
然后将所有条目写入表中,从左到右,必要时跳转到新行。
例如对于 AAAAABBBCCC
你会得到一个像这样的表格:
要生成最终的分布式数组,只需自上而下读取条目,必要时转移到新列。
在上面的例子中,你会得到 ABCABABACAC
。
获得重复条目的唯一方法是在一列中有两个相同的字符,或者在移到右侧的一列时遇到相同的字符。
第一种情况不会发生,因为字符组需要环绕,而这不会发生,因为没有字符组长于列数(这就是我们定义表格的方式)。
第二种情况只能在第二行未满时发生。例如。 AAAABB
在第二行留下两个空单元格。
关于php - 统一排列/分布数组项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42148064/