質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • SQL

    2394questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • Hive

    47questions

    Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。

SQL:カウント結果をカラムに追加する方法

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 138

fuusuke

score 4

環境:Hadoop(HDFS)
言語:hive

以下、t1というテーブルが存在しているとします。

DESC t1;
name       STRING →重複あり
sales_cate    STRING
sales_price   INT

・t1:データ例
name    sales_cate  sales_price
sato    shirts      100
sato    pants       100
sato    pants       200
suzuki  shirts      200
suzuki  blouse      300
kato    sweater     200

t1において、nameごとの売上件数(nameの行が何行あるか)カラムを追加する方法を教えてください。
・期待する結果
name    sales_cate sales_price sales_count
sato    shirts    100         3
sato    pants     100         3
sato    pants       200      3
suzuki  shirts      200         2
suzuki  blouse      300         2
kato    sweater     200         1

私はこれまでは、以下のように一度COUNTをSELECTした結果をテキストに出力させてから、
新規で作成したt2テーブルにLOADし、
さらに新規で作成したt3テーブルにt1とt2をJOINした結果を
INSERT OVERWRITEするという方法をとっていましたが、
恐らくこんなまどろっこしいやり方をする必要はないのでは、と考えています。。

SELECT
name
,COUNT(DISTINCT name)
FROM
t1
GROUP BY
name
>count_output.txt


なんでこんなカウントカラムが必要なのかとつっこみをうけそうですが、
あくまでダミーデータとお考えください。。
イメージ的に、売上件数を閾値として何件以上の社員を抽出する、ようなことをしたいですが、
閾値は現時点では未定のため変動させられるように、
テーブルのカラムとして保持したいと考えています。

初心者ですみませんが、ご教授いただけます様よろしくお願いいたします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

select *
     ,(select count(*) from t1 where name_id=main.name_id) as sales_count
from t1 as main

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/29 01:30

    >sazi様
    ご回答いただきありがとうございます。
    t1テーブルを拡張させたい場合は、以下の認識であっていますでしょうか?

    ALTER TABLE t1 ADD sales_count;
    INSERT INTO t1(sales_count)
    SELECT (SELECT COUNT(*) FROM t1 WHERE name_id=main.name_id) AS sales_count
    FROM t1 as main;

    キャンセル

  • 2018/05/29 09:06

    INSERT OVERWRITE かと思いますので、selectでは他のカラムも指定して下さい。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.50%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • SQL

    2394questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • Hive

    47questions

    Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。