目前我们正在使用三个嵌套的 foreach 循环来获取运行批处理的信息。但是,我相当确定我们可以使用带有连接和子查询的单个 MySQL 语句来获取信息。
我们有大约 30 个类别和 2000 名用户。我们的目标是大约 100 个类别和 100000 个用户,但显然 foreach 循环并不理想(即使现在它们运行大约需要一分钟)。
情况: 用户希望在某个区域有可用的交易工作时得到通知
目标: 批处理(每日、每周等)通知放入发件箱
技术: PHP, MySQL
我目前拥有的:
数据库:
"table.notification_options" : [id][user_id][category]
"table.user" : [id][user_id][method_of_contact][contact_frequency][center_of_work_area_long][center_of_work_area_lat][distance_from_center]
"table.work" : [id][post_date][longitude][latitude][category]
代码:
foreach user{
foreach category tracked{
foreach job in category posted <> $current_date-$batch_frequency{
if job inside workspace{
notify_user(job);
}
}
}
}
想要的结果是以user_id为key的job_id数组组成的数组 [user_id]=>{工作}
例如
{
[user1]{
job1,
job4,
job28
},
[user34]{
job3,
job4,
job34,
job78
}
{
编辑:
我可以更高效地为一个用户选择所有作业。但它仍然需要一个 foreach 用户。
$category_id = get_category_from_notification_options($userid);
$user_distance = get_user_work_distance($userid);
"SELECT DISTINCT work.ID as workID, ( 6371 * acos( cos( radians(-46.409939) ) * cos( radians( jobs.lat ) ) * cos( radians( jobs.lng ) - radians(168.366180) ) + sin( radians(-46.409939) ) * sin( radians( jobs.lat ) ) ) )
AS distance
FROM work,user
WHERE work.categoryID == $category_id
HAVING distance < $user_distance
ORDER BY distance";
最佳答案
我认为您应该以相反的方式进行,以提高效率。下面我将向您展示我用来创建查询的过程。因此,只有最终查询才是您所需要的。但我解释了这些步骤,也许它会在未来对你有所帮助。
首先,我会选择所有作业。如果您的目标是 100.000 个用户,那么工作岗位很可能比用户少得多。
select JOB.id, JOB.category
FROM table.work JOB
现在我们有了所有的工作,让我们看看哪些用户想要得到通知。
select JOB.id, JOB.category, NOTIFY.user_id
FROM table.work JOB
LEFT JOIN table.notification_options NOTIFY
ON JOB.category=NOTIFY.category
WHERE NOTIFY.user_id IS NOT NULL
这会为每个作业创建一个列表,其中包含所有想要收到通知的用户 ID。我添加了 WHERE
子句以从列表中删除没人想看到的所有作业。
现在我们可以JOIN
users 表来获取用户详细信息。
select JOB.id
, JOB.post_date
, JOB.longitude
, JOB.latitude
, USR.user_id
, USR.method_of_contact
, USR.contact_frequency
, USR.center_of_work_area_long
, USR.center_of_work_area_lat
, USR.distance_from_center
, ((ACOS(SIN(USR.center_of_work_area_lat * PI() / 180) * SIN(JOB.latitude * PI() / 180) + COS(USR.center_of_work_area_lat * PI() / 180) * COS(JOB.latitude * PI() / 180) * COS((USR.center_of_work_area_long – JOB.longitude) * PI() / 180)) * 180 / PI()) * 60 * 1.1515) AS `distance`
FROM table.work JOB
LEFT JOIN table.notification_options NOTIFY
ON JOB.category=NOTIFY.category
LEFT JOIN table.user USR
ON NOTIFY.user_id=USR.user_id
WHERE NOTIFY.user_id IS NOT NULL
HAVING `distance`<=USR.distance_from_center
ORDER BY USR.user_id ASC, distance ASC
我在查询中包括了距离。请注意,我使用 HAVING
来检查距离是否小于用户提供的距离。如果将它添加到 WHERE
子句中,您会收到一条错误消息,指出 distance
是未知列。
我还添加了 ORDER BY
类,首先根据用户 ID 对其进行排序,然后再根据距离进行排序。这将使您更容易在 PHP 中创建所需的数组。
现在有很多方法可以实现每日/每周间隔。其中之一是为每个间隔创建单独的脚本,并且只选择设置它的用户。 例如,您可以创建一个每天运行的脚本“daily.php”并进行以下查询
select JOB.id
, JOB.post_date
, JOB.longitude
, JOB.latitude
, USR.user_id
, USR.method_of_contact
, USR.contact_frequency
, USR.center_of_work_area_long
, USR.center_of_work_area_lat
, USR.distance_from_center
, ((ACOS(SIN(USR.center_of_work_area_lat * PI() / 180) * SIN(JOB.latitude * PI() / 180) + COS(USR.center_of_work_area_lat * PI() / 180) * COS(JOB.latitude * PI() / 180) * COS((USR.center_of_work_area_long – JOB.longitude) * PI() / 180)) * 180 / PI()) * 60 * 1.1515) AS `distance`
FROM table.work JOB
LEFT JOIN table.notification_options NOTIFY
ON JOB.category=NOTIFY.category
LEFT JOIN table.user USR
ON NOTIFY.user_id=USR.user_id
WHERE NOTIFY.user_id IS NOT NULL
AND USR.contact_frequency = 'daily'
HAVING `distance`<=USR.distance_from_center
ORDER BY USR.user_id ASC, distance ASC
现在我们有了查询,让我们为它创建 PHP 代码。我们可以遍历所有行并创建数组。显然,您也可以直接处理结果,而不是创建数组。因为如果您先创建一个数组,之后您确实需要再次遍历该数组。
<?php
$arNotify = array();
foreach ($queryresult as $row) {
$userid = $row->user_id;
$jobid = $row->id;
//check if there is an entry for the user in the database, else create it
if (!array_key_exists($userid, $arNotify))
$arNotify[$userid] = array();
//and then push the job
$arNotify[$userid][] = $jobid;
//the array is being created, but I still like to process the job directly
//notify_user($userid, $jobid);
}
var_dump($arNotify);
?>
你去吧,你想要的数组,作业按最接近的顺序排序。
关于php - 作业跟踪的批处理通知,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15378266/