気象庁が出している過去の気象データ(csvファイル)から機械学習を行っているのですが、エラーが出ました。次元を変えることはエラーコードからわかるのですが、他の質問者の方の文を拝読してもわからなかったためお教え願いたいです。
hist = ・・・でエラー↓ Erorr when checking input: expecting lstm_1_input to have 3 dimensions, but got array with shape(6927,100)
該当のソースコード
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sklearn.preprocessing as sp
from sklearn import preprocessing
from keras.models import Sequential
from keras.layers.core import Dense, Activation
from keras.layers.recurrent import LSTM
from sklearn.preprocessing import MinMaxScaler
from keras.optimizers import Adam
from keras.callbacks import EarlyStopping
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
#データの読み込み
df = pd.read_csv('1996Sapporo.csv',encoding = "Shift_JIS") #csv読み込み
df =df.fillna(method='ffill') #欠損値NaNを除外(前の値で置き換え)
tenki = df.loc[:, '天気'] #'天気'の列を配列に格納
tenki = tenki.values #配列:天気1~15のデータ値
print(tenki)
print(len(tenki)) #データ数184104
input_data_length = 10 #テストデータ量
X,Y = [], [] #Xは天気データ Yは正解ラベルのデータ
for i in range(len(tenki) - input_data_length): #range(始まりの数値(略可), 最後の数値(略不可), 増加する数値(略可))
X.append(tenki[i:(i+input_data_length)])
Y.append(tenki[i+input_data_length])
X = np.array(X)
Y = np.array(Y)
print(X)
print(Y)
N_train = int(len(df) * 0.8)
N_test = len(tenki) - N_train
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = N_test, shuffle = False)
a, b = X_train.shape
X_train = np.reshape(X_train, (a, b, 1))
#隠れ層の数を定義
n_in = 1 #入力層
n_hidden = 10 #隠れ層
n_out = 1 #出力層
#モデル作成
model = Sequential()
#入力層 から 隠れ層
model.add(LSTM(n_hidden, input_shape=(input_data_length, n_in), kernel_initializer='random_uniform', return_sequences = False))
#隠れ層 から 出力層 恒等関数の使用
model.add(Dense(n_out, kernel_initializer = 'random_uniform'))
model.add(Activation("linear"))
#確率的勾配降下法 Adam
#lr:0以上の浮動小数点数.学習率 beta_1:浮動小数点数,0<beta<1.一般的に近い値
opt = Adam(lr = 0.1, beta_1 = 0.9, beta_2 = 0.999)
#損失関数 二条平均誤差
model.compile(loss = 'mean_squared_error', optimizer = opt)
print('optimizer ok')
= np.reshape(Y_train, (Y_train.shape[0], 1, Y_train.shape[1]))
early_stopping = EarlyStopping(monitor = 'loss', patience = 10, verbose = 1)
hist = model.fit(X_train, Y_train, batch_size = input_data_length, epochs = 100, callbacks = [early_stopping])
print('model ok')
損失のグラフ化
loss = hist.history['loss']
epochs = len(loss)
plt.rc('font', family = 'serif')
fig = plt.figure()
fig.patch.set_facecolor('white')
plt.plot(range(epochs), loss, marker = '.', label = 'loss(training data)')
plt.show()
予測結果
predicted = model.predict(X_test)
predicted = scaler.inverse_transform(predicted)
Y_test = scaler.inverse_transform(Y_test)
result = pd.DataFrame(predicted)
result.columns = ['predict']
result['actual'] = Y_test
result.plot()
plt.xlim(0,200)
plt.show()
testScore = np.sqrt(mean_squared_error(Y_test, predicted))
print('Test Score: %.2f RMSE' % (testScore))
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。