質問編集履歴

5

微修正

2023/10/05 02:55

投稿

signyah
signyah

スコア1

test CHANGED
File without changes
test CHANGED
@@ -1,7 +1,7 @@
1
1
  ### 実現したいこと
2
2
 
3
3
  Digdagのバージョンを0.10.4→0.10.5にアップデートを実施しました。
4
- Digdagでスケジュール通りにワークフローが実行されない事象(3時間以上の遅延)を確認しています。
4
+ アップデートを実施したのちデータ転送基盤の正常性を確認したところ、Digdagでスケジュール通りにワークフローが実行されない事象(3時間以上の遅延)を確認しています。
5
5
  本遅延の原因の解明、および事象解消したく検討しています。
6
6
 
7
7
 

4

微修正

2023/10/05 02:45

投稿

signyah
signyah

スコア1

test CHANGED
File without changes
test CHANGED
@@ -24,7 +24,7 @@
24
24
  +notice:
25
25
  echo>: "[WARN] Execution Time 60 minutes Exceeded."
26
26
  ```
27
- sla.dig
27
+ schedule.dig
28
28
  ```
29
29
  schedule:
30
30
  hourly>: 00:00

3

微修正

2023/10/05 02:41

投稿

signyah
signyah

スコア1

test CHANGED
File without changes
test CHANGED
@@ -24,6 +24,7 @@
24
24
  +notice:
25
25
  echo>: "[WARN] Execution Time 60 minutes Exceeded."
26
26
  ```
27
+ sla.dig
27
28
  ```
28
29
  schedule:
29
30
  hourly>: 00:00

2

環境等の情報を追加。

2023/10/05 02:41

投稿

signyah
signyah

スコア1

test CHANGED
File without changes
test CHANGED
@@ -1,12 +1,41 @@
1
1
  ### 実現したいこと
2
2
 
3
+ Digdagのバージョンを0.10.4→0.10.5にアップデートを実施しました。
3
4
  Digdagでスケジュール通りにワークフローが実行されない事象(3時間以上の遅延)を確認しています。
4
- 本遅延解消したく検討しています。
5
+ 本遅延の原因の明、および事象解消したく検討しています。
5
6
 
6
7
 
7
8
  ### 前提
8
9
 
9
10
  AWS Fargate上でDigdag serverコンテナ+Digdag workerコンテナ+Embulkコンテナでデータ転送基盤を構築しています。
11
+ 環境: Digdag: 0.10.4→0.10.5
12
+ Amazon Linux:
13
+ public.ecr.aws/amazonlinux/amazonlinux:2.0.20230119.1
14
+ →public.ecr.aws/amazonlinux/amazonlinux:2.0.20230628.0
15
+ Farggate Spot
16
+ Postgre SQL:13.10
17
+ 設定ファイル:
18
+ sla.dig
19
+ ```
20
+ sla:
21
+ #duration: 時:分:秒(経過時間)
22
+ duration: 01:00:00
23
+ fail: false
24
+ +notice:
25
+ echo>: "[WARN] Execution Time 60 minutes Exceeded."
26
+ ```
27
+ ```
28
+ schedule:
29
+ hourly>: 00:00
30
+ skip_on_overtime: false
31
+ ```
32
+
33
+ ログ:
34
+ 原因となるログが確認できていません。
35
+ scheduler等をDigdagのOS標準出力のログを確認していますが、上記SLA違反(3時間以上の遅延によるdurationを超えたログ)は確認しています。
36
+ ```
37
+ [CRITICAL] Execution Time 60 minutes Exceeded.
38
+ ```
10
39
 
11
40
  ### 発生している問題・エラーメッセージ
12
41
 
@@ -39,10 +68,12 @@
39
68
 
40
69
  ### 補足情報(FW/ツールのバージョンなど)
41
70
 
42
- 特にありません。
43
-
44
71
  Digdagサーバのスケジュール実行がさぼっているように見受けられます。
45
72
  遅延発生から3日経過しますが、改善の状況が見られません。
46
73
 
74
+ 以下2点、ご教示ください。
75
+ ・next_schedule_time(3 hours ago) をスケジュール通りの実行時刻に戻す方法
76
+ ・原因究明のためのdigdagログの検索方法
77
+
47
78
  確認観点が不足していればご指摘お願いします。
48
79
  以上、よろしくお願いします。

1

タイトルがわかりづらいため、変更

2023/10/02 09:25

投稿

signyah
signyah

スコア1

test CHANGED
@@ -1 +1 @@
1
- Digdagにてスケジュール通りにワークフローが実行され3時間以上遅延して実行され
1
+ Digdagにてスケジュール通りにワークフローが実行されず、next_run_timeが3時間以上遅延
test CHANGED
File without changes