Python,機械学習,scikit-learnについての質問です。
自作のデータセットを用いて二値分類を行おうとしています。
Python3入門ノートという本のサンプルコードを真似して、
自作のexcelデータをShuffleSplitにかけようとした所でエラーが生じてしまいます。
どう検索しても同じようなエラーの方を見つけられずに困っています。
間違っている部分をどう書けばいいか教えてくださると幸いです。
エラーメッセージは以下のようなものです。
"None of [Int64Index([ 85, 6,154・・・・1795],\n dtype='int64', length=1265)] are in the [columns]"
Excelのデータは以下のようなデータセットを作成しました。
通電回数 通電時間 判定
660 23934 1
97 3307 0
1444 43800 1
:
:
:
3695 230700 1
以下に、自分の書いたコードを記述させていただきます。
import pandas as pd
import numpy as np
from sklearn.model_selection import ShuffleSplit
df=pd.read_excel('python用サンプル.xlsx',sheetname='サンプル')
print(df.head())
X_col_names=['通電回数','通電時間']
y_col_name=['判定']
X=df[X_col_names]
y=df[y_col_name]
ss = ShuffleSplit(n_splits=1, train_size=0.6, test_size=0.4, random_state=0)
train_index, test_index = next(ss.split(X))
X_train, y_train = X[train_index], y[train_index]←ここでエラー
X_test, y_test = X[test_index], y[test_index]
お手数ですがご指南よろしくお願い致します。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/11/02 03:06