sklearnのtrain_test_splitでX,yを分割したのですが、引数を6つとっているのにy_train_named, y_test_named
とy_train, y_test
の大きさ75:25で同じになっています。リファレンスを見てもランダムに分割するとしか書いてありませんでした。なぜこのようなことが起るのでしょうか。
from sklearn.ensemble import GradientBoostingClassifier from sklearn.datasets import make_circles X,y = make_circles(noise=0.25, factor=0.5, random_state=1) y_named = np.array(['blue','red'])[y] X_train, X_test, y_train_named, y_test_named, y_train, y_test = train_test_split(X,y_named, y, random_state=0) print(X.shape, y.shape) print(X_train.shape, X_test.shape, y_train_named.shape, y_test_named.shape, y_train.shape, y_test.shape) >>> (100, 2) (100,) >>> (75, 2) (25, 2) (75,) (25,) (75,) (25,)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。