質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.54%

  • SQL

    2964questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

SQLでの最大値を持つレコードの取得方法について

解決済

回答 3

投稿

  • 評価
  • クリップ 0
  • VIEW 24K+

zkzi3254

score 4

題名の通りなのですが、あるグループ毎にあるカラムの値が最大のレコードを取得する方法についての質問です。
調べたり自分で考えてみたところ

SELECT *
FROM
    (
        SELECT *
        FROM product
        ORDER BY price DESC
    ) product
GROUP BY type
SELECT *
FROM product
INNER JOIN(
        SELECT MAX(price) AS max_price,
        *
        FROM product
        GROUP BY type
    ) tmp
ON product.id = tmp.id
AND product.price = tmp.max_price
SELECT *
FROM product
WHERE product.price = (
        SELECT MAX(price)
        FROM product AS tmp
        WHERE product.type = tmp.type
    )
SELECT *
FROM product
WHERE NOT EXISTS(
        SELECT 1
        FROM product AS tmp
        WHERE product.type = tmp.type
        AND product.price < tmp.price
    )


とりあえずこれだけの方法がありました。
どれがコストなどの観点から見て良いものなのでしょうか?
またこれらより優れた方法があれば教えていただきたいです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

+3

Postgresでのテストですので参考まで
SQL文は上から順に(1)(2)(3)(4)としました。
※SQL文の1番目のものは、PostgresではSQLエラーでした。ですので対象外といたしました。
postgresでは * のgroup byができませんし、出力順が保証されていません。

検査対象件数は1万件としました。(インデックスは有りません)
結果は、costを実行時間とすると、早いもの順で(4)<(2)<(3)となります。
特に(3)は、条件の部分でSQLその都度実行される事により、他の2つより大変時間が掛かる結果となっています。

EXPLAIN ANALYZEの結果
Execution time:実行時間です(ミリ秒)

NO.2
                                                               QUERY PLAN
----------------------------------------------------------------------------------------------------------------------------------------
 Hash Join  (cost=230.30..1015.16 rows=56 width=12) (actual time=48.100..85.661 rows=3383 loops=1)
   Hash Cond: ((product.type = product_1.type) AND (product.price = (max(product_1.price))))
   ->  Seq Scan on product  (cost=0.00..167.20 rows=11220 width=12) (actual time=0.017..15.101 rows=10001 loops=1)
   ->  Hash  (cost=227.30..227.30 rows=200 width=8) (actual time=48.040..48.040 rows=3334 loops=1)
         Buckets: 4096 (originally 1024)  Batches: 1 (originally 1)  Memory Usage: 163kB
         ->  HashAggregate  (cost=223.30..225.30 rows=200 width=8) (actual time=36.361..42.345 rows=3334 loops=1)
               Group Key: product_1.type
               ->  Seq Scan on product product_1  (cost=0.00..167.20 rows=11220 width=8) (actual time=0.007..16.087 rows=10001 loops=1)
 Planning time: 0.329 ms
 Execution time: 90.400 ms
(10 rows)

NO.3
                                                        QUERY PLAN
--------------------------------------------------------------------------------------------------------------------------
 Seq Scan on product  (cost=0.00..2192583.25 rows=56 width=12) (actual time=4.054..12745.577 rows=3383 loops=1)
   Filter: (price = (SubPlan 1))
   Rows Removed by Filter: 6618
   SubPlan 1
     ->  Aggregate  (cost=195.39..195.40 rows=1 width=4) (actual time=1.235..1.246 rows=1 loops=10001)
           ->  Seq Scan on product tmp  (cost=0.00..195.25 rows=56 width=4) (actual time=0.577..1.174 rows=3 loops=10001)
                 Filter: (product.type = type)
                 Rows Removed by Filter: 9998
 Planning time: 0.143 ms
 Execution time: 12776.098 ms
(10 rows)

NO.4
                                                         QUERY PLAN
----------------------------------------------------------------------------------------------------------------------------
 Hash Anti Join  (cost=307.45..667.49 rows=9350 width=12) (actual time=36.436..78.295 rows=3383 loops=1)
   Hash Cond: (product.type = tmp.type)
   Join Filter: (product.price < tmp.price)
   Rows Removed by Join Filter: 14529
   ->  Seq Scan on product  (cost=0.00..167.20 rows=11220 width=12) (actual time=0.011..15.269 rows=10001 loops=1)
   ->  Hash  (cost=167.20..167.20 rows=11220 width=8) (actual time=36.365..36.365 rows=10001 loops=1)
         Buckets: 16384  Batches: 1  Memory Usage: 519kB
         ->  Seq Scan on product tmp  (cost=0.00..167.20 rows=11220 width=8) (actual time=0.009..18.940 rows=10001 loops=1)
 Planning time: 0.164 ms
 Execution time: 83.163 ms
(10 rows)

(2)につきましてもPostgres都合上、下記に修正いたしました。

SELECT product.*
FROM product
INNER JOIN(
        SELECT type, MAX(price) AS max_price
        FROM product
        GROUP BY type
    ) tmp
ON product.type = tmp.type
AND product.price = tmp.max_price;

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/02/27 17:49

    丁寧な回答ありがとうございます!参考にさせていただきます

    キャンセル

+1

各クエリの実行計画をしらべればどれが低コストなのかがわかると思いますが。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/02/27 17:47

    全くの初心者なもので実行計画というものすら知りませんでした。すみません。

    キャンセル

+1

1つ目のSQLはGROUP BYで指定されておらず、集約関数でもリテラルでもないカラムをSELECT句に含むため、文法エラーになると思われます。MySQLだとエラーにならないかもしれませんが、それでも正しい結果は保障されません。

その他のSQLではどれかが決定的に早い or 遅いというものはないと思います。入っているデータ(統計情報)、張られている索引、DBMS次第でどれがベストかは変わってくるので、実行計画を確認するのが一番です。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/02/27 17:48

    1つ目のような書き方は駄目だったんですね…

    キャンセル

同じタグがついた質問を見る

  • SQL

    2964questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。