我有一个非常大的数据库,一个表中有大约 1.2 亿条记录。在将它分成几个表(可能对其进行规范化)之前,我先清理了该表中的数据。该表的列如下: "id(Primary Key), userId, Url, Tag "。这基本上是 delicious 网站数据集的一个子集。正如我所说,每一行都有一个 id、userID 和一个 url,只有“一个”标签。因此,例如 delicious 网站中的书签由单个 url 的多个标签组成,这对应于我的数据库的几行。例如:
"id"; "user" ;"url" ;"tag" "38";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"ajax" "39";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"api" "40";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"javascript" "41";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"library" "42";"12c2763095ec44e498f870ed67ee948d";"http://forkjavascript.org/";"rails"
我需要一个查询来计算标记用于 url 的次数。 谢谢你的帮助
最佳答案
这个查询应该适合你:
SELECT tag, url, count(tag) FROM table GROUP BY tag, url
虽然还没有为您测试过。
关于sql - 在 mysql 中选择使用计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2761150/