質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
AWS Glue

AWS Glueは、分析のためのデータの抽出や変換、ロードを簡単にするフルマネージド型のサービスです。データ処理の自動化の他、データ収集やETL処理も自動化・サーバレス化することが可能。AWSに保存したデータを指定すると、AWS Glueでデータ検索することもできます。

Spark

Spark(Apache Spark)とは、膨大なデータを迅速、柔軟に分散並行処理を行うフレームワークです。分析ツールであるApache Hadoopと比較し、最大で100倍の速度でデータ処理ができるとされています。

Q&A

解決済

1回答

265閲覧

AWS Glue Job をStep Functionsで並列に実行するとエラーになり原因がわかりません

hidesroon

総合スコア1

AWS Glue

AWS Glueは、分析のためのデータの抽出や変換、ロードを簡単にするフルマネージド型のサービスです。データ処理の自動化の他、データ収集やETL処理も自動化・サーバレス化することが可能。AWSに保存したデータを指定すると、AWS Glueでデータ検索することもできます。

Spark

Spark(Apache Spark)とは、膨大なデータを迅速、柔軟に分散並行処理を行うフレームワークです。分析ツールであるApache Hadoopと比較し、最大で100倍の速度でデータ処理ができるとされています。

0グッド

0クリップ

投稿2023/10/11 05:44

編集2023/10/11 08:54

実現したいこと

AWS Step Functions でGlue Job を複数並列で動かしたいですが
エラーが出ており、その原因がわかりません

どなた様か、何かアドバイス頂けますでしょうか?
ご確認いただければ幸いです

前提

Step Functionsではマシンステートが完了していますが
Glue Jobのログを見ると、エラーが出ています

3つのGlue Jobを動かしていますが
どのエラーも『⚫️⚫️⚫️のカラムがない』となっていますが、存在しています

スクリプト内でprint() している箇所を見ると
確かにカラムが存在しません。スキーマが読み込めていないです

Glue Jobを単体で動かしたり
Step Functionsでエラーが出ているGlue Jobを1つだけ実行すると完了します

〜〜〜〜〜〜〜〜〜〜〜〜〜〜【確認画像1】〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
イメージ説明

〜〜〜〜〜〜〜〜〜〜〜〜〜〜【確認画像2】〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜

イメージ説明

〜〜〜〜〜〜〜〜〜〜〜〜〜〜【確認画像3】〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
イメージ説明

発生している問題・エラーメッセージ

AnalysisException: Column '-------id' does not exist. Did you mean one of the following? [];. Note: This run was executed with Flex execution. Check the logs if run failed due to executor termination.

該当のソースコード

ソースコード

試したこと

Did you mean one of the following? で検索したり
Glue Job の並列実行での注意点
などで検索しましたが、似た様な事例や解決方法が見つかっておりません

bookmark が怪しかと思い、有効・無効で動かしてみましたが
ここではなさそうでした

イメージ説明

補足情報(FW/ツールのバージョンなど)

SparkのGlue Job で バージョンは 4.0 です。PySparkで記述しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

自己解決

こちら解決しました。Step Functions側で、
タスクが完了するまで待機 という箇所にチェックを入れておりませんでした・・・
基本的な所を理解できておりませんでした

投稿2023/10/18 09:11

hidesroon

総合スコア1

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問