回答編集履歴

1

誤って回答途中に投稿したため

2018/01/17 18:54

投稿

R.Shigemori
R.Shigemori

スコア3376

test CHANGED
@@ -1 +1,3 @@
1
- 説明変数の数は100×100ではなく、100+100で済むと思います。
1
+ 説明変数の数は100×100ではなく、100+100で済むと思います。100×100というのは父方の特徴と母方の特徴の組み合わせを網羅するために必要な最低限のデータ件数を意味します。
2
+
3
+ 例えば、父に皮膚が固いという変数、母に尾が短いという変数がある場合、説明変数自体は1+1で済ませます。そのかわり、データの組み合わせ(1,0)、(1,1)、(0,0)、(0,1)はデータ件数側でカバーさせれば良いのではないかという発想です。ただ仮に1万パターン必要とするとデータ件数5万は少し足りない気がします。単純計算で1パターンに5件しかないことになるためです。説明変数を削れば網羅すべき組み合わせが減るので1パターン当たりのデータ件数が増えるでしょうから、用途に応じて調整したほうがいいでしょう