回答編集履歴
4
追記に説明追加
test
CHANGED
@@ -15,5 +15,5 @@
|
|
15
15
|
|
16
16
|
---
|
17
17
|
**【追記】**
|
18
|
-
model.fitに渡す訓練データはx_train[train], 正解ラベルはy_train[t
|
18
|
+
model.fitに渡す訓練データはx_train[train], 正解ラベルはy_train[train]としないとkfold.split(x_train, y_train)の意味なく全ての訓練データとラベルで学習してしまっていますね。model.fitのvalidation_dataの指定はしないで、model.evaluateでx_train[test], y_train[test]を使えば良いかと思います。
|
19
19
|
|
3
追記
test
CHANGED
@@ -13,3 +13,7 @@
|
|
13
13
|
> 解決次第、trainデータ、validationデータ、testデータの3つに分けて学習・評価を行おうと思っています。
|
14
14
|
は不要で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いかと思います。
|
15
15
|
|
16
|
+
---
|
17
|
+
**【追記】**
|
18
|
+
model.fitに渡す訓練データはx_train[train], 正解ラベルはy_train[test]としないとkfold.split(x_train, y_train)の意味なく全ての訓練データとラベルで学習してしまっていますね。
|
19
|
+
|
2
説明を修正
test
CHANGED
@@ -1,5 +1,5 @@
|
|
1
1
|
> これは何を層化k分割交差検証しているのでしょうか。
|
2
|
-
"y_trainのクラスラベル"で"x_trainを"です。
|
2
|
+
"y_trainのクラスラベル"で"x_trainを層化"です。
|
3
3
|
|
4
4
|
> 公式サイトを見ましたがよく理解できませんでした。
|
5
5
|
根気良くドキュメントを読むしかないと思います。
|
@@ -8,8 +8,8 @@
|
|
8
8
|
|
9
9
|
> 次の①、②、③のうちどれが正しいのか、あるいはどれも正しくないのか教えてただきたいです。
|
10
10
|
どれも違います。まず 16,758 を 2 で割ると 8379 で 8329 ではありません。
|
11
|
-
今回で言えば分割した片方を訓練データ、もう片方を検証データとして使用します。
|
11
|
+
今回で言えば分割した片方を訓練データ、もう片方を検証データとして使用します。(正確には関数の戻り値はindexです)
|
12
12
|
ですので
|
13
13
|
> 解決次第、trainデータ、validationデータ、testデータの3つに分けて学習・評価を行おうと思っています。
|
14
|
-
は不要で
|
14
|
+
は不要で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いかと思います。
|
15
15
|
|
1
文言を修正
test
CHANGED
@@ -11,5 +11,5 @@
|
|
11
11
|
今回で言えば分割した片方を訓練データ、もう片方を検証データとして使用します。
|
12
12
|
ですので
|
13
13
|
> 解決次第、trainデータ、validationデータ、testデータの3つに分けて学習・評価を行おうと思っています。
|
14
|
-
は不要で交差検証で良い結果が出たモデルにてテストデータを用いた評価を行い最終判断すれば良いです。
|
14
|
+
は不要で交差検証で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いです。
|
15
15
|
|