SQLのGROUP BYについて聞きたいことがあります！！

musicテーブル

id	name

favoriteテーブル

id	music_id	member_id

music.idとfavorite.music_idは外部結合されています。
favorite.member_idはその音楽が好きな人のIDを指しています。

このときに楽曲の名前（music.name）とその音楽が好きな人の数を抽出したいです。（0人のときは0を）

そこで自分は

sql
1SELECT
2      music.name,
3      COALESCE(COUNT(favorite.music_id) , 0 )
4FROM
5      music
6LEFT OUTER JOIN
7      favorite ON music.id = favorite.music_id
8GROUP BY
9      music.id
10

としました。

その際、GROUP BYをmusic.nameにしてはいけないのかの疑問が浮かびました。

GROUP BYをmusic.nameにしてはいけない理由などありましたら、ご回答したいただけると幸いです

takasima20

2021/05/17 12:26

同名の曲はない前提なのかな?

dekasan

2021/05/17 12:28

同名の曲はない前提です！

takasima20

2021/05/17 12:56

ならどっちでもいいんじゃ?

行動規範の内容に同意します

回答1件

同名の曲は存在しないという前提で回答します。

musicテーブルはidがPKで、nameに対しては索引が作られていないとすると、
music.idでgroup by したほうが music.name でgroup by するより若干速度が速いです。

試しにpostgresqlにmusicを1000件、favoriteを100000件入れて速度差を比較すると、
idでgroupbyした場合は平均0.042秒ほどで、nameでgroupbyした場合は平均0.046秒ほどかかりました。
データ数が少ないので一概には言えませんが、nameの方が1割ほど時間がかかります。

集計速度に差が出る原因として考えられるのは、以下の点です。