题目描述

表:Stadium

Column Name Type
id int
visit_date date
people int

visit_date 是表的主键 每日人流量信息被记录在这三列信息中:序号 (id)、日期 (visit_date)、 人流量 (people) 每天只有一行记录,日期随着 id 的增加而增加

编写一个 SQL 查询以找出每行的人数大于或等于 100 且 id 连续的三行或更多行记录。

返回按 visit_date 升序排列的结果表。

输入表

id visit_date people
1 2017-01-01 10
2 2017-01-02 109
3 2017-01-03 150
4 2017-01-04 99
5 2017-01-05 145
6 2017-01-06 1455
7 2017-01-07 199
8 2017-01-09 188

查询结果格式如下所示。

id visit_date people
5 2017-01-05 145
6 2017-01-06 1455
7 2017-01-07 199
8 2017-01-09 188

id 为 5、6、7、8 的四行 id 连续,并且每行都有 >= 100 的人数记录。 请注意,即使第 7 行和第 8 行的 visit_date 不是连续的,输出也应当包含第 8 行,因为我们只需要考虑 id 连续的记录。 不输出 id 为 2 和 3 的行,因为至少需要三条 id 连续的记录。

相关知识

本题不需要任何前置知识

解题过程

  1. 分析题意

    • 筛选掉人数小于100的id,日期和人数
    • 因为日期随着id增加而增加,所以对筛选后的表进行一次关于id的不并列排名,用id减去这个排名,当结果相同的便是连续的,这是因为这个差值是已经删掉的id数,当差值不变时,说明没有新的被删,也就是连续
    • 综合前两步进行一次查询,查询表记作表a
    • 找出结果相同的且出现次数超过2的差值,记作表b
    • 当a差值在出现b表中时返回数据
  2. 编写SQL

    WITH CTE AS (SELECT id,visit_date,people, (id-(ROW_NUMBER() OVER(ORDER BY id))) AS sid FROM Stadium WHERE people > 99)
    SELECT 
        id,visit_date,people
    FROM
        CTE
    WHERE
        CTE.sid IN(
            SELECT
                sid
            FROM
                CTE
            GROUP BY sid
            HAVING COUNT(sid)>2
        )
    

学习总结

  1. 在编写SQL前,要先考虑好解题过程,否则会越写越糊涂