Hive

Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。

RSS
  • 受付中

    回答
    2

    セキュリティの関わる問題なので削除させていただきました。

    セキュリティの関わる問題なので削除させていただきました。  

    • 0評価
    • 551PV
    kei344 kei344 12時間前に コメント
  • 受付中

    回答
    2

    セキュリティの関わる問題なので削除させていただきました。

    セキュリティの関わる問題なので削除させていただきました。   

    • 0評価
    • 733PV
    amaguri amaguri 3週間前に 質問を編集
  • 解決済

    回答
    1

    セキュリティの関わる問題なので削除させていただきました。

    セキュリティの関わる問題なので削除させていただきました。  

    • -3評価
    • 552PV
    amaguri amaguri 3週間前に 質問を編集
  • 受付中

    回答
    0

    セキュリティの関わる問題なので削除させていただきました。

    セキュリティの関わる問題なので削除させていただきました。    

    • 0評価
    • 587PV
    amaguri amaguri 3週間前に 質問を編集
  • 受付中

    回答
    3

    SQL:条件の結果をすでに存在するテーブルにINSERTする方法

    環境:Hadoop(HDFS)環境 言語:hive 以下2つ(t1,t2)のテーブルが存在するとします。 DESC t1; name_id INT ・t1のデータ例 name_id 1 3 5 7 9 DESC t2; name_id INT department STRING ・t2のデータ例 name_id department 1  

    • 0評価
    • 107PV
    nak nak 1ヶ月前に 回答を編集
  • 受付中

    回答
    0

    hive 階層パーティションを持つテーブルからの部分指定ロードの仕方

    下記の様に、階層パーティションを持つテーブルから、上位のパーティションのみ指定して それ以下をロードすることができるのでしょうか? CREATE EXTERNAL TABLE IF NOT EXISTS sample_data ( id int, name string ) PARTITIONED BY (yyyy string, mm string

    • 0評価
    • 39PV
    teratailが1ヶ月前に アップデート
  • 解決済

    回答
    1

    SQL(Hive):初期値を設定しながら、カラムを追加する方法

    環境:Hadoop(HDFS) 言語:Hive Hiveにて、すでに存在するテーブルに対して、 初期値を設定しながらカラムを追加する方法が知りたいです。 既存テーブル:t1 id name 1 sato 2 suzuki 3 tanaka 期待する結果:t1 id name class 1 sato

    • 0評価
    • 71PV
    sazi sazi 1ヶ月前に コメント
  • 受付中

    回答
    1

    SQL(Hive):UNION ALLした結果をOVERWRITEする方法

    環境:Hadoop(HDFS) 言語:Hive Hiveにて複数テーブルをUNION ALLした結果を、 新しいテーブルにOVERWRITEする方法が知りたいです。 既存テーブル:t1 id name 1 sato 2 suzuki 3 tanaka 既存テーブル:t2 id name 4 ito

    • 0評価
    • 63PV
    Orlofsky Orlofsky 1ヶ月前に 回答を編集
  • 解決済

    回答
    1

    SQL:カウント結果をカラムに追加する方法

    環境:Hadoop(HDFS) 言語:hive 以下、t1というテーブルが存在しているとします。 DESC t1; name       STRING →重複あり sales_cate   STRING sales_price INT ・t1:データ例 name sales_cate sales_price sato shir

    • 0評価
    • 66PV
    sazi sazi 1ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    Hive:テキストファイルからテーブルを生成する方法について

    Hadoop(HDFS領域)環境です。 タブ区切りのテキストファイル(.txt)が存在するとします。 そのデータをテーブルにしたい場合はどのようにすればよいでしょうか。 まずは該当のカラムを持つテーブルをCREATE TABLEしてあげる必要があるとは思うのですが、その後にファイルを読み込ませる方法がわ

    • 0評価
    • 78PV
    Orlofsky Orlofsky 1ヶ月前に ベストアンサー
  • 解決済

    回答
    1

    beelineコマンドの実行を含むコマンドをバックグラウンドで実行する方法

    beelineコマンドを含むbashスクリプトを作成しています。 fgで実行した場合、問題なく実行できるのですが、bgで実行した場合タスクが停止状態になってしまいます。 beelineコマンドをバックグラウンドで実行するにあたりなにか制約などありますか? OS: CentOS release 6.5 (Final) Hive: Apache Hi

    • 0評価
    • 175PV
    ksilverwall ksilverwall 2ヶ月前に 回答
  • 解決済

    回答
    1

    Hive:作成されたテーブルのクエリ確認方法について

    最近業務上でHadoop,Hiveを使い始めたのですが元々SQLの知識に乏しく、 わからないことだらけです…出来る限り調べながらご質問しておりますが、 トンチンカンな質問をしてしまっていたら大変申し訳ないです。 前提・実現したいこと 現在Hadoop上のhiveを用いて、様々なテーブルからデータを抽出しております。 hiveの機能についての質問ですが、

    • 0評価
    • 106PV
    azs azs 2ヶ月前に コメント
  • 解決済

    回答
    1

    hiveの実行でエラー

    こちらの記事を参考にHadoop+hiveを試してみようと思いました。 https://qiita.com/genzouw/items/59705fcfd4af1c5369e1 環境はCentOS+Vagrantです。 最初、そのままではうまくいかず環境変数やHBaseを入れ直したりはしまして、 hiveコマンドを試したところ、 $ hive E

    • 0評価
    • 153PV
    xxyyxx xxyyxx 3ヶ月前に ベストアンサー
  • 受付中

    回答
    0

    hiveで処理するときの並列数、できるファイルの数はどこでわかる

    hiveで 処理するときの並列数や できるファイルの数はどこでわかりますか? また、メモリ不足で落ちてしまうとき、 どこをいじればよいでしょうか?

    • 0評価
    • 96PV
    teratailが3ヶ月前に アップデート
  • 受付中

    回答
    0

    hiveでhdfs上のpyファイルを使えるようにするには

    hiveにて自作のスクリプトを利用した処理をいれたいです。 通常はadd fileで ローカルから ファイルをアップしてそのスクリプトを叩くのですが、スクリプトファイル群が重いので、 これらをhdfs上に起き、 それをtransformで使いたいです。 これは具体的にどうやってできますでしょうか?

    • 0評価
    • 128PV
    teratailが4ヶ月前に アップデート
  • 解決済

    回答
    1

    【Hive】トリガー機能について

    HiveでSQLにあるトリガー機能が使いたいと思います。 特定のテーブルにデータがINSERTされたことをきっかけに、 VIEWを作りたいのですが、その方法としてトリガー機能が使えればと考えました。 「hive trigger」などで検索してみましたが、 実装方法のサンプルページなどはヒットせず、 https://issues.apache.org/ji

    • 0評価
    • 775PV
    chokojori chokojori 8ヶ月前に コメント
  • 受付中

    回答
    0

    hiveのクエリをpresto、postgresで書き換える

    トレジャーデータにおいて、hiveでこれまで書いていたクエリをprestoで書くことになりました prestoはpostgresの書き方と同じなので、postgres に変換できれば大丈夫です 以下コード例です。 DISTRIBUTE BY COALESCE(user_id, TD_MD5(concat(useragent,ip))) SORT BY COA

    • 0評価
    • 398PV
    teratailが10ヶ月前に アップデート
  • 解決済

    回答
    1

    hiveにてlzoファイルの読み込み、表示方法がわからない

    hadoop上のパスに、テキストを圧縮した1つのlzoファイルがあります。 これに対して、 ・適当なテーブルを作り、そこにlzoファイルを読み込み ・そのファイルの中身を上から数行表示する をやるためのhiveコードを 具体的に(すぐ動作するものを)知りたいです。 よろしくお願いします。

    • 0評価
    • 217PV
    zinzin5210 zinzin5210 4ヶ月前に ベストアンサー
  • 受付中

    回答
    0

    HiveQLのLOCATION構文について

    しょぼい質問となり申し訳ございません。 HiveQLのLOCATIONについて質問です。 CREATE EXTERNAL TABLE IF NOT EXISTS archivelog_${DATE} ( id int, count int ) ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

    • 0評価
    • 292PV
    teratailが10ヶ月前に アップデート
  • 受付中

    回答
    1

    文字列のみのレコードで、group byを用いて最後のレコードを抽出する方法

    初めて質問します。 当方sqlやhiveは初心者です。 表題通り、文字列のみで構成されたレコードからgroup byを用いて最後のレコードを抽出する方法が分かりません。 具体的には、以下のようなレコードがあります。 id user address -------------------- aaa hoge tokyo ccc fuga tokyo

    • 0評価
    • 463PV
    otsuki_takaya 退会済みユーザー 1年以上前に 回答
1

タグ情報

  • あなたの順位

    -

  • タグ登録者数

    41

  • 総質問数

    45

  • 今週の質問数

    0

関連するタグ

Hiveタグのよく見られている質問

思考するエンジニアのためのQ&Aサイト「teratail」について詳しく知る