model_selection.train_test_splitにおける引数を調べました。
すると以下の内容が出てきます。
test_size : テストデータの割合を 0.0 〜 1.0 の間で指定します。
train_size : トレーニングデータの割合を 0.0 〜 1.0 の間で指定します。
ここでどうやってトレーニングデータとテストデータを認識しているのか疑問に思いました。
以下自分の本関数に対する認識が正しいか確認をお願いします。
model_selection.train_test_splitは与えられたデータに対して二つのリストを返す。
二つのリストの内前のリストの比率を引数: train_size で
2つのリストの内後のリストの比率を引数: test_size で定める。
よって
data_train,data_test =
の様に
トレーニングデータ,テストデータ
として置く慣習があり、その為前のリストの比率を決めればトレーニングデータの比率を、後のリストの比率を変えればテストデータの比率を変えられる。
この認識であってるでしょうか。
python
1"""学習データと検証データに分類""" 2from sklearn import model_selection 3 4data_train,data_test = model_selection.train_test_split(data,train_size = 0.8)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/06 12:27