前提・実現したいこと
機械学習, kerasによるmodel.fit
機械学習初心者で、層を重ねて簡単なものを作っていたらエラーにぶち当たりました.
元データ(データサイズ約40000)があり、それを用いてやっていたところ、それでは上手くできたのですが,,, データサイズを変えてみようとのことで、その元データを1/4にして使用したところ、変える前には起きなかったエラーが起きてお手上げ状態です(コード自体はいろいろな先駆者様からお借りしたものをツギハギしたものかつ、自分で色々いじったものなので見にくいかもしれないです).
発生している問題・エラーメッセージ
IndexError: index 9687 is out of bounds for axis 1 with size 9190
エラーメッセージ IndexError Traceback (most recent call last) <ipython-input-80-f1e8134ceed1> in <module> 37 early_stopping = EarlyStopping(patience=0, verbose=1) 38 ---> 39 fit = model.fit(train[X], keras.utils.to_categorical(train[y], 2), 40 callbacks=[early_stopping],validation_split=0.1,verbose=2) 41 IndexError: index 9687 is out of bounds for axis 1 with size 9190 ### 該当のソースコード ```ここに言語名を入力 python ソースコード ```#l1正則化0.01, dropout=0.5 import keras from keras.models import Sequential from sklearn.model_selection import train_test_split from keras.layers import Dense, Dropout, Activation import pandas as pd import numpy as np from keras.utils import np_utils, to_categorical from sklearn.metrics import r2_score from keras import regularizers import matplotlib.pyplot as plt from keras.optimizers import Adam from livelossplot import PlotLossesKeras from sklearn.model_selection import StratifiedKFold from keras.callbacks import EarlyStopping df = pd.read_excel("~~~") df1 = np.array(df) X = df1[:,0:8] y = df1[:,[8]] kfold = StratifiedKFold(n_splits=10, shuffle=True, random_state=5) for train, test in kfold.split(X, y): model = Sequential() model.add(Dense(units=8, activation='relu', input_dim=8,kernel_regularizer=keras.regularizers.l2(0.01))) model.add(Dropout(0.5)) model.add(Dense(units=2, activation='softmax', input_dim=8)) ----for文はここまで---- model.compile(loss='binary_crossentropy',optimizer=Adam(lr=1e-3),metrics=['accuracy']) early_stopping = EarlyStopping(patience=0, verbose=1) fit = model.fit(train[X], keras.utils.to_categorical(train[y], 2), callbacks=[early_stopping],validation_split=0.25,verbose=2) loss, accuracy = model.evaluate(test[X], keras.utils.to_categorical(test[y], 2),verbose=0) print("\nloss:{} accuracy:{}".format(loss, accuracy)) #学習曲線 fig, (axL, axR) = plt.subplots(ncols=2, figsize=(10,4)) # loss def plot_history_loss(fit): # Plot the loss in the history axL.plot(fit.history['loss'],label="loss") axL.plot(fit.history['val_loss'],label="val_loss") axL.set_title('model loss') axL.set_xlabel('epoch') axL.set_ylabel('loss') axL.legend(loc='upper right') # acc def plot_history_acc(fit): # Plot the loss in the history axR.plot(fit.history['acc'],label="acc") axR.plot(fit.histry['val_acc'],label="val_acc") axR.set_title('model accuracy') axR.set_xlabel('epoch') axR.set_ylabel('accuracy') axR.legend(loc='upper right') plot_history_loss(fit) plot_history_acc(fit) ### 試したこと エラーの内容的にmodel.fitの箇所が間違っているとのことで、そこに関して色々調べてみたはいいものの、どうやらtrain[X]自体が違うような気がして(それ以降をいじっても同じエラーが出る)、元データが悪いのか?という感じになっています。 ### 補足情報(FW/ツールのバージョンなど) Mac OS 10.13.6
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/05/25 13:41
2019/05/25 13:51
2019/05/25 14:04
2019/05/26 02:06