・時間配列を作る方法を教えて欲しいです。
元の表から、特定のデータをグループ化し、複数行を一行にまとめ、
属性ごと(今回は、時間単位)に列へ入れるのが目的
グループ化するカラム:datetime(date部分), user_id, datetime(trunc_time部分), item_id
配列化したいカラム:trunc_timeの値、valueの合計、対象のCOUNT(item_idの数)
ARRAY[
ARRAY['00:00:00',SUM(value:数値),COUNT(item_id)]
,ARRAY['01:00:00',SUM(value:数値),COUNT(item_id)]
...
,ARRAY['23:00:00',SUM(value:数値),COUNT(item_id)]
]
これを作る最もEXPLAIN的にコストの低いSQLがあれば、教えて欲しいです。
※Planning time, Execution timeどちらも重視します。
と言うのも、実際は、数件ではなく、一日分で、十数万件分のレコードが格納されております。
そちらをPDFへ出力する際に、データの丸め込みを行って、数人~三十人分を一ヵ月分等で出力するため、
SQLのメインレコード的には、900件ですが、item_id毎に特定の加工を施して、LEFT OUTER JOINします。
...出来る事なら、JOINは一回(*1)で済ませたいので、各item_id毎JOIN(*2)よりもコストの低い実現が望ましいです。
*1:実行結果(EXPLAIN ANALYZE)
計画行:65行
Planning time: 2.051ms
Execution time: 89.219 ms
*2:実行結果(EXPLAIN ANALYZE)
計画行:334行
Planning time: 177.550ms
Execution time: 116.606 ms
** これが元データ **
id | user_id | datetime | item_id | value |
---|---|---|---|---|
1 | 101 | 2019/08/31 22:35:51 | 1 | 500 |
2 | 101 | 2019/08/31 01:54:32 | 2 | 500 |
3 | 101 | 2019/08/31 15:57:20 | 3 | 500 |
4 | 101 | 2019/08/31 19:18:45 | 2 | 500 |
5 | 101 | 2019/09/01 10:09:58 | 1 | 500 |
6 | 101 | 2019/09/01 20:21:30 | 2 | 500 |
7 | 101 | 2019/09/01 11:02:49 | 3 | 500 |
8 | 101 | 2019/09/01 08:35:12 | 1 | 500 |
** これが作りたい **
user_id | date | item_id | values{'time','sum(value)','count(item_id)'} |
---|---|---|---|
101 | 2019/08/31 | 1 | {{'00:00:00',400,2},{'01:00:00',NULL,0},{'02:00:00',800,5},...} |
101 | 2019/08/31 | 2 | {{'00:00:00',400,2},{'01:00:00',NULL,0},{'02:00:00',800,5},...} |
101 | 2019/08/31 | 3 | {{'00:00:00',400,2},{'01:00:00',NULL,0},{'02:00:00',800,5},...} |
101 | 2019/09/01 | 1 | {{'00:00:00',400,2},{'01:00:00',NULL,0},{'02:00:00',800,5},...} |
101 | 2019/09/01 | 2 | {{'00:00:00',400,2},{'01:00:00',NULL,0},{'02:00:00',800,5},...} |
101 | 2019/09/01 | 3 | {{'00:00:00',400,2},{'01:00:00',NULL,0},{'02:00:00',800,5},...} |
該当のソースコード
SQL
1WITH temp_datas AS ( 2 SELECT * 3 FROM ( 4 VALUES 5 (1,101,'2019/08/31 22:35:51'::TIMESTAMP,1,500) 6 ,(2,101,'2019/08/31 01:54:32'::TIMESTAMP,2,500) 7 ,(3,101,'2019/08/31 15:57:20'::TIMESTAMP,3,500) 8 ,(4,101,'2019/08/31 19:18:45'::TIMESTAMP,2,500) 9 ,(5,101,'2019/09/01 10:09:58'::TIMESTAMP,1,500) 10 ,(6,101,'2019/09/01 20:21:30'::TIMESTAMP,2,500) 11 ,(7,101,'2019/09/01 11:02:49'::TIMESTAMP,3,500) 12 ,(8,101,'2019/09/01 08:35:12'::TIMESTAMP,1,500) 13 ) AS temp (id, user_id, datetime, item_id, value) 14) 15SELECT 16 td.user_id 17 ,td.item_id 18 ,td.date 19 -- ここを作成中 20 -- これは、あまり参考にならない。。。作りかけ箇所 21 ,ARRAY[ 22 ARRAY[ 23 '00:00:00' 24 ,SUM(CASE WHEN td.time= '00:00:00' THEN td.value END)::TEXT 25 ,COUNT(CASE WHEN td.time= '00:00:00' THEN 1 ELSE 0 END)::TEXT 26 ], 27 ARRAY[ 28 '01:00:00' 29 ,SUM(CASE WHEN td.time= '01:00:00' THEN td.value END)::TEXT 30 ,COUNT(CASE WHEN td.time= '01:00:00' THEN 1 ELSE 0 END)::TEXT 31 ], 32 -- ...続く 33 ARRAY[ 34 '23:00:00' 35 ,SUM(CASE WHEN td.time= '23:00:00' THEN td.value END)::TEXT 36 ,COUNT(CASE WHEN td.time= '23:00:00' THEN 1 ELSE 0 END)::TEXT 37 ] 38 ] AS values 39 -- ... 40FROM ( 41 SELECT 42 * 43 ,temp_datas.datetime::DATE AS date 44 ,TO_CHAR(DATE_TRUNC('hour', temp_datas.datetime::TIMESTAMP), 'HH24:MI:SS') AS time 45 FROM 46 temp_datas 47 ) AS td 48GROUP BY 49 td.user_id 50 ,td.item_id 51 ,td.date
補足情報(FW/ツールのバージョンなど)
PostgreSQL_version 9.5
回答1件
あなたの回答
tips
プレビュー