关于MySQL和Group By的一段讨论

2024-04-26 itknight Comments 0 Comment

我

姓名分数更新时间

张三 1 2024年4月25日15:11:02

张三 2 2024年4月25日15:11:06

张三 3 2024年4月25日15:11:05

李四 4 2024年4月25日15:11:01

李四 5 2024年4月25日15:11:05

李四 6 2024年4月25日15:11:07

王五 7 2024年4月25日15:11:01

王五 8 2024年4月25日15:11:05

王五 9 2024年4月25日15:11:00

假设他们现在在一个mysql数据表 t_score 中，我想通过一跳sql语句查询到每个人的最新成绩，这条语句要怎么写?

姓名	分数	更新时间
张三	1	2024年4月25日15:11:02
张三	2	2024年4月25日15:11:06
张三	3	2024年4月25日15:11:05
李四	4	2024年4月25日15:11:01
李四	5	2024年4月25日15:11:05
李四	6	2024年4月25日15:11:07
王五	7	2024年4月25日15:11:01
王五	8	2024年4月25日15:11:05
王五	9	2024年4月25日15:11:00

高手

要查询每个人的最新成绩，你可以使用MySQL中的GROUP BY和JOIN语句来实现。首先，你需要根据每个人的姓名分组，并找到他们最新的更新时间。然后，基于这个时间和姓名，再次从原表中查询对应的分数。下面是一个可能的SQL查询语句示例：
SELECT t1.姓名, t1.分数, t1.更新时间
FROM t_score t1
JOIN (
    SELECT 姓名, MAX(更新时间) AS 最新时间
    FROM t_score
    GROUP BY 姓名
) t2 ON t1.姓名 = t2.姓名 AND t1.更新时间 = t2.最新时间;
这里的逻辑是：

子查询（t2）从t_score表中选择每个姓名对应的最大（即最新）更新时间。

主查询（t1）则从t_score表中选择姓名、分数和更新时间。

使用JOIN操作将这两个查询结果联结在一起，联结条件是姓名相同且更新时间等于每个人的最新更新时间。

这样的查询能够确保你得到的是每个人最新的分数记录。如果有任何具体的表结构或索引等优化问题，也可以进一步讨论和调整。

我

上面那条sql可以得到如下结果吗?

张三 3 2024年4月25日15:11:05

李四 6 2024年4月25日15:11:07

王五 8 2024年4月25日15:11:05

张三	3	2024年4月25日15:11:05
李四	6	2024年4月25日15:11:07
王五	8	2024年4月25日15:11:05

高手

是的，上面提供的SQL语句正是用来获取你提出的这种结果：每个人的最新成绩记录。根据你的数据：

张三最新的更新时间是2024年4月25日15:11:06，但在此之前更新时间为2024年4月25日15:11:05时的分数是3分。

李四最新的更新时间是2024年4月25日15:11:07，相应的分数是6分。

王五最新的更新时间是2024年4月25日15:11:05，相应的分数是8分。

不过，我注意到之前提供的时间有一处笔误：张三的最新成绩应该是2分（2024年4月25日15:11:06）。如果你希望基于最新时间所对应的成绩，正确的结果应该是：

张三 2 2024年4月25日15:11:06

李四 6 2024年4月25日15:11:07

王五 8 2024年4月25日15:11:05

如果我们期望得到你刚才提问中的结果（张三的分数是3分），可能需要重新检查数据或我的理解。如果有任何具体的需求或错误，请指出，我可以帮助纠正或提供更合适的解决方案。

我

最新版的mysql 已经不推荐使用 group by了，有办法在不使用group by的情况下查询到这个结果吗

高手

在MySQL中，尽管对于某些特定的使用场景GROUP BY可能不被推荐，特别是在涉及到全文分组时可能会引发性能问题，但在许多常见的数据聚合需求下，GROUP BY仍然是有效且常用的。不过，如果你希望避免使用GROUP BY，可以考虑使用其他方法如窗口函数（Window Functions），这些在MySQL 8.0及以后的版本中支持。

使用窗口函数

窗口函数提供了一种方式来处理数据分组和排序，而不必在输出结果中进行分组，可以用来解决这种最新记录的查询问题。例如，我们可以使用ROW_NUMBER()窗口函数按更新时间给每个用户的记录进行排序，并选择每个用户最新的记录：
WITH RankedScores AS (
    SELECT 
        姓名, 
        分数, 
        更新时间,
        ROW_NUMBER() OVER (PARTITION BY 姓名 ORDER BY 更新时间 DESC) AS rn
    FROM 
        t_score
)
SELECT 姓名, 分数, 更新时间
FROM RankedScores
WHERE rn = 1;
这里是步骤说明：

WITH语句中创建一个临时结果RankedScores，包含所有原始表t_score的列。

使用ROW_NUMBER()函数为每组姓名分配一个序号，序号根据更新时间降序排列。

在最外层的查询中从RankedScores中选择那些rn = 1的记录，即每个姓名组里更新时间最新的记录。

这个方法不使用GROUP BY语句，而是利用窗口函数来实现同样的目的，应该能满足你的需求。

我

如果是 5.7这个版本，还有办法做到吗

高手

在MySQL 5.7版本中，因为窗口函数还未被支持，我们无法使用ROW_NUMBER()等函数。不过，还有其他方法可以实现类似的效果，尽管可能不那么优雅或直观。我们可以使用一个自连接查询来获取每个人的最新成绩，这种方法虽然需要用到GROUP BY，但是它更符合MySQL 5.7的功能限制。下面是一个示例：
SELECT a.姓名, a.分数, a.更新时间
FROM t_score a
INNER JOIN (
    SELECT 姓名, MAX(更新时间) AS 最新时间
    FROM t_score
    GROUP BY 姓名
) b ON a.姓名 = b.姓名 AND a.更新时间 = b.最新时间;
这里的逻辑是：

子查询（别名为b）找出每个人最新的更新时间。

主查询（别名为a）选择姓名、分数和更新时间。

使用INNER JOIN将主查询和子查询的结果连接起来，连接条件是姓名和更新时间匹配。

这种方法在MySQL 5.7中是有效的，因为它使用了内部连接和聚合函数来获取每个姓名的最新记录。它不需要依赖MySQL 8.0及以上版本的新特性，如窗口函数。

如果你需要避免使用GROUP BY，可以考虑其他替代方案，如使用程序代码进行后处理或更改数据的存储方式，例如在更新数据时维护一个当前有效记录的指示器，但这将涉及到应用逻辑或数据库设计的更改。希望这些信息对你有帮助！如果有其他问题，随时联系。

我是能行CTO

因为喜欢，所以热爱！

关于MySQL和Group By的一段讨论

2024-04-26 itknight Comments 0 Comment

使用窗口函数

发表回复取消回复

使用窗口函数

发表回复 取消回复

发表回复取消回复