Python
1X_train = features_df.ix[:, 1:] 2y_train = features_df['labels'] 3 4forest = RandomForestClassifier(min_samples_leaf=3, random_state=0) 5forest.fit(X_train, y_train)
#X_train 1 2 3 4 5 6 7 0 0.000031 0.000132 0.000123 0.000072 0.000034 0.000429 0.000026 1 0.000069 0.000347 0.000129 0.000088 0.000056 0.000622 0.000042 2 0.000085 0.000393 0.000099 0.000067 0.000051 0.000570 0.000041 3 0.000070 0.000385 0.000095 0.000062 0.000039 0.000455 0.000035 4 0.000035 0.000229 0.000093 0.000064 0.000018 0.000274 0.000017 5 0.000015 0.000170 0.000092 0.000061 0.000030 0.000304 0.000019 .. ... ... ... ... ... ... ... 67 0.001043 0.000010 0.000012 0.000010 0.000010 0.000046 0.000025 68 0.000963 0.000007 0.000025 0.000006 0.000005 0.000031 0.000024 69 0.000074 0.000014 0.000012 0.000009 0.000016 0.000056 0.000053 70 0.000750 0.000005 0.000014 0.000009 0.000016 0.000063 0.000077 71 0.001324 0.000011 0.000012 0.000017 0.000004 0.000028 0.000021
以上のようなコードで、ランダムフォレストに説明変数(X_train)を入力したときに、X_trainはどのようなデータを1個として入力されるのでしょうか。
例:0.000031を1個のデータとするのか、[0.000031 0.000132 0.000123 0.000072 0.000034 0.000429 0.000026]の7個を1つのデータとして見るのか
よろしくお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/01/22 09:06