質問編集履歴

2

2018/12/29 23:45

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -1 +1 @@
1
- 外部で学習したモデルでsagemakerエンドポイントを作成す方法
1
+ AWSのアカウントレベルでサービス利用が制限され問題について
test CHANGED
@@ -1,23 +1,17 @@
1
- sagemakerで外部で作成済みモデルをもとに、エンドポイントを作成しようとしたのですが、
1
+ AWSの無料枠の個人用アカウントでsagemakerのエンドポイントを作成しようとしたのですが、次のようなエラーが出ました
2
2
 
3
3
 
4
4
 
5
- ・推論コードのDockerイメージしてパス
5
+ ```
6
6
 
7
- ・訓練済みモデルのs3パス(s3://image-ing/sagemaker-resnet/model.tar.gz)
7
+ ResourceLimitExceeded: An error occurred (ResourceLimitExceeded) when calling the CreateTrainingJob operation: The account-level service limit 'ml.p2.xlarge for training job usage' is 0 Instances, with current utilization of 0 Instances and a request delta of 1 Instances. Please contact AWS support to request an increase for this limit.
8
8
 
9
9
 
10
10
 
11
- の二つをどのようにして、使用してエンドポイントを使用したらいいのでしょうか?
11
+ ```
12
12
 
13
13
 
14
14
 
15
- レーニングジョブを使用せずに、いきなりモデルから作成することは可能でしょうか?
15
+ これはアカウンが無料枠だからでしょうか?解決策して有料に変更すればいいのでしょうか?
16
16
 
17
-
18
-
19
- 今の所モデルから作成ても、エラーが出て作成できなす。
17
+ 素人なため初歩的質問申訳ありません。ご教授お願します。
20
-
21
-
22
-
23
- 外部で学習したモデルを使ったエンドポイントの作成方法を教えてください。

1

追記

2018/12/29 23:45

投稿

trafalbad
trafalbad

スコア303

test CHANGED
@@ -1 +1 @@
1
- sagemakerエンドポイントを作成した際に、CloudWatch logsに送信されないエラーについて
1
+ 外部で学習したモデルでsagemakerエンドポイントを作成する方法
test CHANGED
@@ -2,40 +2,22 @@
2
2
 
3
3
 
4
4
 
5
- トブックタンスから、モデル、エンドポイント設定、エンドポイントの作成
5
+ ・推論コドのDockerメージしてパ
6
6
 
7
- まで以下ことに注意して行いました。
7
+ ・訓練済みモデルs3パス(s3://image-ing/sagemaker-resnet/model.tar.gz)
8
8
 
9
9
 
10
10
 
11
- ・トレーニングジョブを作成せず、モデルから作成する
12
-
13
- ・推論コードDockerイメージしてパス指定した
11
+ 二つをどのようにして、使用してエンドポイント使用したらいいのでしょうか?
14
-
15
- ・訓練済みモデルのs3パスを指定しない(s3://image-ing/sagemaker-resnet/model.tar.gz)
16
12
 
17
13
 
18
14
 
19
-
20
-
21
- エンドポイントを作成したとき、以下のようにcloudwatch logsにアクセスできないとのエラーが出ました。[sagemakerはモニタリングするためcloudwatch logsにもつながっているらしい](https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/logging-using-cloudtrail.html)のですが、このエラーは何が原因なのでしょうか?
22
-
23
- ```
24
-
25
- # エラー
26
-
27
- The primary container for production variant default-variant-name did not pass the ping health check. Please check CloudWatch logs for this endpoint.
28
-
29
- ```
15
+ トレーニングジョブを使用せずに、いきなりモデルから作成することは可能でしょうか?
30
16
 
31
17
 
32
18
 
33
- #追記
19
+ 今の所モデルから作成しても、エラーが出て作成できないです。
34
20
 
35
- またモデルの作成で訓練済みモデルを指定したら次のようなエラーが出ました(アクセス権限は付与しました)
36
21
 
37
- ```
38
22
 
39
- Failed to extract model data archive for container "container_1" from URL "s3://image-ing/sagemaker-resnet/model.tar.gz". Please ensure that the object located at the URL is a valid tar.gz archive.
23
+ 外部で学習したモデルを使ったエンドポイントの作成方法を教えてください。
40
-
41
- ```