質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.51%

日付、ユーザごとに、特定アイテムをカウントしたい

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 429

score 23

SQLのことで教えていただけませんか。

user_tblに、そのユーザが最も好きなアイテム(top1),2番目に好きなアイテム(top2)があります。
shopping_tblに、その日にユーザが得たアイテムが、日付順で1つずつ並んでいます。

user_tbl
|id|date|top_1|top_2|
|01|0101|item_a|item_b|
|01|0102|item_a|item_b|



|99|1231|item_c|item_b|

shopping_tbl
|id|date|item|
|01|0101|item_a|
|01|0101|item_a|
|01|0101|item_c|
|01|0101|item_b|



|99|1231|item_c|

上記から、各ユーザがその日に得たアイテムのうちtop1,top2に該当するものを集計してcount_tblを作りたいです。

count_tbl
|id|date|top1_count|top2_count|
|01|0101|2|1|
|01|0102|3|0|



|99|1231|4|0|

どなたか、お知恵を貸していただけないでしょうか。
最終的にはHiveに翻訳する予定ですが、SQLで教えていただければと思います。

いくつかクエリを流していますが、COUNT(item) OVER(PARTITION BY id, item)でうまくいかず、LEFT OUTER JOINではすべての列を出すことができなくて悩んでいます。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • Satomi07

    2021/01/30 01:09 編集

    以前、質問して得たSQL文を、自分でhiveに翻訳してうまく行きました。コピーするつもりではないです。SQLも、まだ書きなれていないため、私には考え方がとても有益です。明日これで試してみます。

    キャンセル

  • Orlofsky

    2021/01/30 07:00

    せっかくURLを提示したのに、読んでないか、読んでも理解できないようで。

    キャンセル

  • Satomi07

    2021/01/30 08:06 編集

    すみません、一応両方の環境を自分で作って試しておりますし、自分でも調べてから質問していますから、このサイトもみました。

    だから、コピーするためだけでない、翻訳すると書きました。

    私は、クエリの構成法を知りたいのです。

    キャンセル

回答 1

checkベストアンサー

+1

追記依頼を見たらHiveではなくても良さそうだったので、MySQLで回答しますが、
副問い合わせと条件付きcountでできると思います。

select query.id, query.date, count(query.item = top_1 or null) as top1_count, count(query.item = top_2 or null) as top2_count from (
select u.*, s.id as s_id, s.date as s_date, s.item from user_tbl u
left outer join shopping_tbl s on u.id = s.id and u.date = s.date and (u.top_1 = s.item or u.top_2 = s.item)
) query
group by query.id, query.date;
テストデータ
-- DDL
CREATE TABLE `shopping_tbl` (
  `id` int NOT NULL,
  `date` varchar(4) DEFAULT NULL,
  `item` varchar(45) DEFAULT NULL
);

CREATE TABLE `user_tbl` (
  `id` int NOT NULL,
  `date` varchar(4) DEFAULT NULL,
  `top_1` varchar(45) DEFAULT NULL,
  `top_2` varchar(45) DEFAULT NULL
);

-- データ
INSERT INTO user_tbl VALUES (1,'0101','item_a','item_b');
INSERT INTO user_tbl VALUES (1,'0102','item_a','item_b');
INSERT INTO user_tbl VALUES (1,'0103','item_c','item_b');
INSERT INTO user_tbl VALUES (99,'1231','item_c','item_b');
INSERT INTO shopping_tbl VALUES (1,'0101','item_a');
INSERT INTO shopping_tbl VALUES (1,'0101','item_a');
INSERT INTO shopping_tbl VALUES (1,'0101','item_c');
INSERT INTO shopping_tbl VALUES (1,'0101','item_b');
INSERT INTO shopping_tbl VALUES (1,'0102','item_a');
INSERT INTO shopping_tbl VALUES (1,'0102','item_a');
INSERT INTO shopping_tbl VALUES (1,'0102','item_a');
INSERT INTO shopping_tbl VALUES (1,'0103','item_a');
INSERT INTO shopping_tbl VALUES (1,'0103','item_b');
INSERT INTO shopping_tbl VALUES (1,'0103','item_a');
INSERT INTO shopping_tbl VALUES (99,'1231','item_c');
結果
id  date  top1_count  top2_count
1  0101  2  1
1  0102  3  0
1  0103  0  1
99  1231  1  0

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2021/02/03 16:42

    SochiAdachi様、ご回答ありがとうございます。
    left outer joinならHiveで行けます、大変助かりました。

    教えていただいたクエリを基にHiveに翻訳して、下記で回すことができました。
    SELECT
    user_tbl.id,
    user_tbl.date_,
    SUM(IF(user_tbl.top_1=shopping_tbl.item,1,0)) AS top1_count,
    SUM(IF(user_tbl.top_2=shopping_tbl.item,1,0)) AS top2_count
    FROM
    user_tbl
    LEFT OUTER JOIN shopping_tbl
    ON(user_tbl.id=shopping_tbl.id AND user_tbl.date_=shopping_tbl.date_)
    GROUP BY user_tbl.id,user_tbl.date_

    errormaker74様、Orlofsky様にも感謝を。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.51%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る