Apache Hadoopは大規模なデータの分散処理をサポートするJavaソフトウェアフレームワークです。Hadoopを利用すると、数千ノードおよびペタバイト級のアプリケーションデータを処理することができます。
Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。
Q&A
1回答
627閲覧
総合スコア10
0グッド
0クリップ
投稿2018/03/24 06:40
0
hiveで 処理するときの並列数や できるファイルの数はどこでわかりますか?
また、メモリ不足で落ちてしまうとき、 どこをいじればよいでしょうか?
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答1件
この2つは参考にならないかな、程度にのっけておく Hadoopチューニング – mapred.map.tasksの意味 Hiveのパフォーマンスチューニングで試した7つのこと
投稿2018/08/25 11:39
総合スコア2009
回答へのコメント
2018/08/25 11:40
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
まだベストアンサーが選ばれていません
アカウントをお持ちの方はログイン
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.48%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
hiveで処理するときの並列数、できるファイルの数はどこでわかる
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/08/25 11:40