質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Hadoop

Apache Hadoopは大規模なデータの分散処理をサポートするJavaソフトウェアフレームワークです。Hadoopを利用すると、数千ノードおよびペタバイト級のアプリケーションデータを処理することができます。

Hive

Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。

Q&A

2回答

3003閲覧

hiveのログの見方が分かりません。

退会済みユーザー

退会済みユーザー

総合スコア0

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Hadoop

Apache Hadoopは大規模なデータの分散処理をサポートするJavaソフトウェアフレームワークです。Hadoopを利用すると、数千ノードおよびペタバイト級のアプリケーションデータを処理することができます。

Hive

Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。

0グッド

0クリップ

投稿2015/10/28 01:13

hiveの実行ログを見ており、下記のように出力がされています。

2015-10-27 15:43:07,528 Stage-2 map = 0%, reduce = 0%
2015-10-27 15:44:08,308 Stage-2 map = 0%, reduce = 0%, Cumulative CPU 277.33 sec
2015-10-27 15:45:08,933 Stage-2 map = 0%, reduce = 0%, Cumulative CPU 576.01 sec
2015-10-27 15:46:09,558 Stage-2 map = 0%, reduce = 0%, Cumulative CPU 877.49 sec
2015-10-27 15:47:10,116 Stage-2 map = 0%, reduce = 0%, Cumulative CPU 1177.78 sec
2015-10-27 15:48:10,633 Stage-2 map = 0%, reduce = 0%, Cumulative CPU 1476.97 sec
2015-10-27 15:49:11,126 Stage-2 map = 0%, reduce = 0%, Cumulative CPU 1776.51 sec

上記の場合の「Cumulative CPU ○sec」はどういった意味を指しているのでしょうか。
どなたかわかる方が、いらっしゃいましたら、よろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

Cumulative というのは、文字通りには 累積的な という意味なので、そのHadoopシステムで処理を開始してからCPUがデータ処理を実施している正味の「累積時間(秒)」だと思います。
(恐らく再起動するとゼロに戻る)

それにしても、結構な時間処理している割に、mapもreduceも0%ですが・・・

投稿2015/10/28 04:01

pi-chan

総合スコア5936

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

Cumulative CPUは、処理に使ったCPUの累積時間です。
上記のログを見た限り処理に時間がかかり、CPUの累積時間が増えているだけと思われます。

投稿2015/10/28 03:40

YuusukeNomura

総合スコア18

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問