質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
HiveQL

HiveQLは、Hive内の管理データを操作するのに使用されるSQL寄りのデータ操作言語です。HiveはHadoop上で動くソフトウェアで、HiveQLで記述した命令をMapReduceに自動に変換することができ、データ解析を容易に行うことが可能になります。

Hadoop

Apache Hadoopは大規模なデータの分散処理をサポートするJavaソフトウェアフレームワークです。Hadoopを利用すると、数千ノードおよびペタバイト級のアプリケーションデータを処理することができます。

Hive

Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。

Q&A

0回答

166閲覧

Hadoop3とHive3の問題解析手法等のノウハウとツールを探しています

kabu-hisa

総合スコア0

HiveQL

HiveQLは、Hive内の管理データを操作するのに使用されるSQL寄りのデータ操作言語です。HiveはHadoop上で動くソフトウェアで、HiveQLで記述した命令をMapReduceに自動に変換することができ、データ解析を容易に行うことが可能になります。

Hadoop

Apache Hadoopは大規模なデータの分散処理をサポートするJavaソフトウェアフレームワークです。Hadoopを利用すると、数千ノードおよびペタバイト級のアプリケーションデータを処理することができます。

Hive

Hiveとは、Hadoop(オープンソースの大規模分散計算フレームワーク)の上で動作するDWH(Data Warehouse:データウエアハウス)向けのプロダクトです。HiveQLというSQLのような言語で、Hadoop上のデータを操作することができます。

0グッド

0クリップ

投稿2024/07/24 12:40

実現したいこと

私たちのチームでは、Apache HadoopとApache Hiveを利用してセンサデータの統計処理を行うシステムを維持管理しており、現在システム更改中です。その作業の中でいくつかのHiveでエラーが発生しており、原因特定と対策の実施が必要な状況となっています。少しでも自分達のチームで主体的に解決できるよう、解析スキルを身につけたいと考えています。

相談したいこと

システム更改に際して、Hadoop0.20とHive0.1.7から、Hadoop3.3.3とHive3.1.3にバージョンアップしています。検証の中でいくつかの問題が発生している状況です。
例えば、Hiveで2つのテーブルをJOINした際、移行元のHiveで実行した際の出力レコード数よりも極端に少ないレコード数しか出力されない事象等が発生しています。JOINしている2つのテーブルのレコード数はそれぞれ約7000万レコードで比較的規模が大きいです。Hiveの設定に問題があるのか、データ自体に問題があるのか、といったことも分からない状態です。

こういった問題を解析したいのですが、我々のチーム内にはノウハウが乏しく、どのような手順や解析ツールで原因調査を進めればよいか分からず困っております。
Hadoop3やHive3における問題解析の一般的な手法や、よく使われている解析ツールといったノウハウを教えて頂きたいです。
経験豊富な皆様からご意見を頂けますと幸いです。

補足情報(FW/ツールのバージョンなど)

[開発中の環境]
・OS:RockyLinux9.0
・Hadoop
・バージョン:3.3.3
・Hive
・バージョン:3.1.3
・Hiveエンジン:MR(TeZは未使用)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問