回答編集履歴

4

追記に説明追加

2024/01/19 15:29

投稿

meg_
meg_

スコア10650

test CHANGED
@@ -15,5 +15,5 @@
15
15
 
16
16
  ---
17
17
  **【追記】**
18
- model.fitに渡す訓練データはx_train[train], 正解ラベルはy_train[test]としないとkfold.split(x_train, y_train)の意味なく全ての訓練データとラベルで学習してしまっていますね。
18
+ model.fitに渡す訓練データはx_train[train], 正解ラベルはy_train[train]としないとkfold.split(x_train, y_train)の意味なく全ての訓練データとラベルで学習してしまっていますね。model.fitのvalidation_dataの指定はしないで、model.evaluateでx_train[test], y_train[test]を使えば良いかと思います。
19
19
 

3

追記

2024/01/19 15:21

投稿

meg_
meg_

スコア10650

test CHANGED
@@ -13,3 +13,7 @@
13
13
  > 解決次第、trainデータ、validationデータ、testデータの3つに分けて学習・評価を行おうと思っています。
14
14
  は不要で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いかと思います。
15
15
 
16
+ ---
17
+ **【追記】**
18
+ model.fitに渡す訓練データはx_train[train], 正解ラベルはy_train[test]としないとkfold.split(x_train, y_train)の意味なく全ての訓練データとラベルで学習してしまっていますね。
19
+

2

説明を修正

2024/01/19 15:16

投稿

meg_
meg_

スコア10650

test CHANGED
@@ -1,5 +1,5 @@
1
1
  > これは何を層化k分割交差検証しているのでしょうか。
2
- "y_trainのクラスラベル"で"x_trainを"です。
2
+ "y_trainのクラスラベル"で"x_trainを層化"です。
3
3
 
4
4
  > 公式サイトを見ましたがよく理解できませんでした。
5
5
  根気良くドキュメントを読むしかないと思います。
@@ -8,8 +8,8 @@
8
8
 
9
9
  > 次の①、②、③のうちどれが正しいのか、あるいはどれも正しくないのか教えてただきたいです。
10
10
  どれも違います。まず 16,758 を 2 で割ると 8379 で 8329 ではありません。
11
- 今回で言えば分割した片方を訓練データ、もう片方を検証データとして使用します。
11
+ 今回で言えば分割した片方を訓練データ、もう片方を検証データとして使用します。(正確には関数の戻り値はindexです)
12
12
  ですので
13
13
  > 解決次第、trainデータ、validationデータ、testデータの3つに分けて学習・評価を行おうと思っています。
14
- は不要で交差検証で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いす。
14
+ は不要で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いかと思います。
15
15
 

1

文言を修正

2024/01/19 15:10

投稿

meg_
meg_

スコア10650

test CHANGED
@@ -11,5 +11,5 @@
11
11
  今回で言えば分割した片方を訓練データ、もう片方を検証データとして使用します。
12
12
  ですので
13
13
  > 解決次第、trainデータ、validationデータ、testデータの3つに分けて学習・評価を行おうと思っています。
14
- は不要で交差検証で良い結果が出たモデルにてテストデータを用いた評価を行い最終判断すれば良いです。
14
+ は不要で交差検証で最も良い結果が出たモデルに対してテストデータを用いた評価を行い最終判断すれば良いです。
15
15