気象庁が出している気象データ(csvファイル)から機械学習を行っている初心者です。
2点質問があります
1.エラー文
(プログラム末文hist = ...)
Error when checking model input: expected lstm_1_input to have 3 dimensions, but got array with shape (1757, 100)
次元を変えることはわかるのですが、他の質問者の方を見ても理解できなかったため質問いたしました。
データは1996年札幌の1時間毎の天気を(1〜15)の数値で表しております。
1→快晴 2→晴れ
データ数366*24=8784個
2.結果のグラフ化がわからないため教えていただきたいです。
例:折れ線で横軸日時、縦軸天気内容(1〜15)
よろしくお願いいたします。
#プログラム
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sklearn.preprocessing as sp
from sklearn import preprocessing
from keras.models import Sequential
from keras.layers.core import Dense, Activation
from keras.layers.recurrent import LSTM
from sklearn.preprocessing import MinMaxScaler
from keras.optimizers import Adam
from keras.callbacks import EarlyStopping
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
df = pd.read_csv('1996Sapporo.csv',encoding = "Shift_JIS") #csv読み込み
df =df.fillna(method='ffill') #欠損値NaNを除外(1時間前の値で置き換え)
time = df.loc[:, '日時'] #日時の配列を格納
tenki = df.loc[:, '天気'] #'天気'の列を配列に格納
tenki = tenki.values #配列:天気1~15のデータ値
print(tenki)
print(len(tenki))
input_data_length = 100 #テストデータ量
X,Y = [], [] #Xは天気データ Yは正解ラベルのデータ
for i in range(len(tenki) - input_data_length): #range(始まりの数値(略可), 最後の数値(略不可), 増加する数値(略可))
X.append(tenki[i:(i+input_data_length)])
Y.append(tenki[i+input_data_length])
X = np.array(X)
Y = np.array(Y)
N_train = int(len(df) * 0.8)
N_test = len(tenki) - N_train
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = N_test, shuffle = False)
#次元(2→3)変換?
a, b = X_train.shape
X_train = np.reshape(X_train, (a, b, 1))
n_in = 1 #入力層
n_hidden = 10 #隠れ層 数が多い程学習モデルの複雑さが増加
n_out = 1 #出力層
model = Sequential()
model.add(LSTM(n_hidden, input_shape=(input_data_length, n_in), kernel_initializer='random_uniform', return_sequences = False))
model.add(Dense(n_out, kernel_initializer = 'random_uniform'))
model.add(Activation("linear"))
opt = Adam(lr = 0.1, beta_1 = 0.9, beta_2 = 0.999)
model.compile(loss = 'mean_squared_error', optimizer = opt)
print('optimizer ok')
early_stopping = EarlyStopping(monitor = 'loss', patience = 10, verbose = 1)
hist = model.fit(X_train, Y_train, batch_size = input_data_length, epochs = 100, callbacks = [early_stopping])
回答1件
あなたの回答
tips
プレビュー