質問編集履歴
5
微修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,7 +1,7 @@
|
|
1
1
|
### 実現したいこと
|
2
2
|
|
3
3
|
Digdagのバージョンを0.10.4→0.10.5にアップデートを実施しました。
|
4
|
-
Digdagでスケジュール通りにワークフローが実行されない事象(3時間以上の遅延)を確認しています。
|
4
|
+
アップデートを実施したのちデータ転送基盤の正常性を確認したところ、Digdagでスケジュール通りにワークフローが実行されない事象(3時間以上の遅延)を確認しています。
|
5
5
|
本遅延の原因の解明、および事象解消したく検討しています。
|
6
6
|
|
7
7
|
|
4
微修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -24,7 +24,7 @@
|
|
24
24
|
+notice:
|
25
25
|
echo>: "[WARN] Execution Time 60 minutes Exceeded."
|
26
26
|
```
|
27
|
-
sl
|
27
|
+
schedule.dig
|
28
28
|
```
|
29
29
|
schedule:
|
30
30
|
hourly>: 00:00
|
3
微修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -24,6 +24,7 @@
|
|
24
24
|
+notice:
|
25
25
|
echo>: "[WARN] Execution Time 60 minutes Exceeded."
|
26
26
|
```
|
27
|
+
sla.dig
|
27
28
|
```
|
28
29
|
schedule:
|
29
30
|
hourly>: 00:00
|
2
環境等の情報を追加。
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,12 +1,41 @@
|
|
1
1
|
### 実現したいこと
|
2
2
|
|
3
|
+
Digdagのバージョンを0.10.4→0.10.5にアップデートを実施しました。
|
3
4
|
Digdagでスケジュール通りにワークフローが実行されない事象(3時間以上の遅延)を確認しています。
|
4
|
-
本遅延
|
5
|
+
本遅延の原因の解明、および事象解消したく検討しています。
|
5
6
|
|
6
7
|
|
7
8
|
### 前提
|
8
9
|
|
9
10
|
AWS Fargate上でDigdag serverコンテナ+Digdag workerコンテナ+Embulkコンテナでデータ転送基盤を構築しています。
|
11
|
+
環境: Digdag: 0.10.4→0.10.5
|
12
|
+
Amazon Linux:
|
13
|
+
public.ecr.aws/amazonlinux/amazonlinux:2.0.20230119.1
|
14
|
+
→public.ecr.aws/amazonlinux/amazonlinux:2.0.20230628.0
|
15
|
+
Farggate Spot
|
16
|
+
Postgre SQL:13.10
|
17
|
+
設定ファイル:
|
18
|
+
sla.dig
|
19
|
+
```
|
20
|
+
sla:
|
21
|
+
#duration: 時:分:秒(経過時間)
|
22
|
+
duration: 01:00:00
|
23
|
+
fail: false
|
24
|
+
+notice:
|
25
|
+
echo>: "[WARN] Execution Time 60 minutes Exceeded."
|
26
|
+
```
|
27
|
+
```
|
28
|
+
schedule:
|
29
|
+
hourly>: 00:00
|
30
|
+
skip_on_overtime: false
|
31
|
+
```
|
32
|
+
|
33
|
+
ログ:
|
34
|
+
原因となるログが確認できていません。
|
35
|
+
scheduler等をDigdagのOS標準出力のログを確認していますが、上記SLA違反(3時間以上の遅延によるdurationを超えたログ)は確認しています。
|
36
|
+
```
|
37
|
+
[CRITICAL] Execution Time 60 minutes Exceeded.
|
38
|
+
```
|
10
39
|
|
11
40
|
### 発生している問題・エラーメッセージ
|
12
41
|
|
@@ -39,10 +68,12 @@
|
|
39
68
|
|
40
69
|
### 補足情報(FW/ツールのバージョンなど)
|
41
70
|
|
42
|
-
特にありません。
|
43
|
-
|
44
71
|
Digdagサーバのスケジュール実行がさぼっているように見受けられます。
|
45
72
|
遅延発生から3日経過しますが、改善の状況が見られません。
|
46
73
|
|
74
|
+
以下2点、ご教示ください。
|
75
|
+
・next_schedule_time(3 hours ago) をスケジュール通りの実行時刻に戻す方法
|
76
|
+
・原因究明のためのdigdagログの検索方法
|
77
|
+
|
47
78
|
確認観点が不足していればご指摘お願いします。
|
48
79
|
以上、よろしくお願いします。
|
1
タイトルがわかりづらいため、変更
test
CHANGED
@@ -1 +1 @@
|
|
1
|
-
Digdagにてスケジュール通りにワークフローが実行され
|
1
|
+
Digdagにてスケジュール通りにワークフローが実行されず、next_run_timeが3時間以上遅延する。
|
test
CHANGED
File without changes
|