使用" select "选择每个组的前两条记录的最佳方法是什么?命令


What is the best way to select the first two records of each group by a "SELECT" command?

例如,我有以下表格:

id group data
1 1 aaa
2 1 aaa
3 2 aaa
4 2 aaa
5 2 aaa
6 3 aaa
7 3 aaa
8 3 aaa

使用"select"命令选择每个组的前两条记录的最佳方法是什么?如果没有好的方法,你建议做什么?(PHP)

(模型结果)

1 1 aaa
2 1 aaa
3 2 aaa
4 2 aaa
6 3 aaa
7 3 aaa

我知道在子查询中a.id>= b.id的交叉连接可以工作,但我正在寻找一个更具可扩展性的解决方案,可以应用于具有数百万条记录的表。由于

select a.*
from Tablename a
where 
(
   select count(*) 
   from Tablename as b
   where a.group = b.group and a.id >= b.id
) <= 2
    <
  • SQLFiddle演示/gh>

我喜欢这个技巧,它利用了GROUP_CONCAT聚合函数和FIND_IN_SET:

SELECT
  Tablename.*
FROM
  Tablename INNER JOIN (
    SELECT `group`, GROUP_CONCAT(id ORDER BY id) ids
    FROM Tablename
    GROUP BY `group`) grp ON
  Tablename.`group` = grp.`group` AND
  FIND_IN_SET(Tablename.id, ids)<=2
ORDER BY
  Tablename.`group`, Tablename.id

性能不能太好,因为它不能利用索引。

或者你也可以这样写:

SELECT t1.id, t1.`group`, t1.data
from
  Tablename t1 INNER JOIN Tablename t2
  ON t1.`group` = t2.`group` AND t1.id>=t2.id
GROUP BY
  t1.id, t1.`group`, t1.data
HAVING
  COUNT(*)<=2
ORDER BY
  t1.`group`, t1.id, t1.data

你选择,过滤和排序你的查询像正常的,然后

SELECT TOP 2 * FROM foo; 

从我能记得的SybaseOracle和可能的其他几个RDBMS的使用这种语法。

for MySQL你做

SELECT * FROM foo LIMIT 2; 

更新:

是的,我误解了你的问题,对不起。似乎我们中的一些人做过:)

然后取决于你的RDBMS是否支持HAVING等。您可以使用HAVING或使用ININ子句中的子查询来构造查询。

对于MSSQL我认为你可以这样做(代码未测试)

SELECT id, data
    FROM (
        SELECT id, data, Rank() over (Partition BY group ORDER BY id DESC ) AS Rank
        FROM table
        ) rs WHERE Rank <= 2)

但是因为这取决于你的RDBMS我要求你看看类似的问题,看看哪一个最适合你的情况,因为MSSQL支持一些东西MySQL不支持,而另一方面。

下面是一些例子

为每个类别选择前10条记录

如何选择MySQL中每个topic_id的最后两条记录