質問編集履歴

分かりやすく書き直し

2020/01/12 00:34

投稿

airi5151

スコア5

test CHANGED Viewed

	@@ -1 +1 @@
1	- ~~学習した結果t~~r~~ain lossとt~~e~~st loss~~がnanになる問題。ぜひご指導よろしくお願い致します。
1	+ 予測値y_predの中身がnanになる問題。ぜひご指導よろしくお願い致します。

test CHANGED Viewed

@@ -1,208 +1,4 @@
 ```ここに言語を入力
-x_cols = ["TEMP_okym","TEMP_hrsm"] + df.columns.tolist()[14:]
-X = df[x_cols]
-y = df["MW"]
-# ラベル付きデータをトレーニングセット (X_train, y_train)とテストセット (X_test,y_test)に分割
-from sklearn import model_selection
-X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, test_size=.2, random_state=42)
-# 正規化
-from sklearn.preprocessing import StandardScaler
-scaler = StandardScaler()
-scaler.fit(X_train)
-X_train = scaler.transform(X_train)
-X_test = scaler.transform(X_test)
-# Chainer読込
-from chainer import Chain, optimizers, Variable
-import chainer.functions as F
-import chainer.links as L
-# ニューラルネットワークのモデル生成用クラス
-class MyChain(Chain):
-    def __init__(self, n_units=10):
-        super(MyChain, self).__init__(
-             l1=L.Linear(len(x_cols), n_units),
-             l2=L.Linear(n_units, n_units),
-             l3=L.Linear(n_units, 1))
-    def __call__(self, X_data, y_data):
-        X = Variable(X_data.astype(np.float32).reshape(len(X_data),len(x_cols))) # Variableオブジェクトに変換
-        y = Variable(y_data.values.astype(np.float32).reshape(len(y_data),1)) # Variableオブジェクトに変換
-        #print(x)
-        #AttributeError: 'Series' object has no attribute 'reshape'とエラーを吐く。values.を追加して解決
-        # 元のサンプルコードから他の変更点：x_data→X_data。x→X
-        #Chainerのお作法で、データは配列からChainerのVariableという型（クラス）のオブジェクトに変換して使う
-        #astype(np.float32):小数へ型変換(cast)?
-        #reshape():NumPyの配列数と大きさの形状変換をする。配列の次元変更。例えばreshape(5,5)は5行5列
-        #組み込み関数len()を使うと、リストや文字列など様々な型のオブジェクトのサイズ（要素数や文字数）を取得できる
-        #B = reshape(A,sz) は、A の形状をサイズ ベクトル sz で定義される size(B) に変更する意味
-        pred = self.predict(X)
-        #print(pred)
-        return F.mean_squared_error(pred, y)
-    def predict(self, X):
-        h1 = F.relu(self.l1(X))
-        h2 = F.relu(self.l2(h1))
-        h3 = self.l3(h2)
-        return h3
-    def get_predata(self, X):
-        return self.predict(Variable(X.astype(np.float32).reshape(len(X),1))).data
-# パラメータ初期化
-batchsize = 16
-n_epoch = 50
-n_units = 10
-# モデル生成
-model = MyChain(n_units)
-optimizer = optimizers.Adam()
-optimizer.setup(model)
-# 学習
-train_losses =[]
-test_losses =[]
-N = len(X_train)
-for epoch in range(1, n_epoch + 1):
-    perm = np.random.permutation(N)
-    sum_loss = 0
-    for i in range(0, N, batchsize):
-        x_batch = X_train[perm[i:i + batchsize]]
-        y_batch = y_train[perm[i:i + batchsize]]
-        model.zerograds()
-        loss = model(x_batch,y_batch)
-        sum_loss += loss.data * batchsize
-        loss.backward()
-        optimizer.update()
-    average_loss = sum_loss / N
-    train_losses.append(average_loss)
-    loss = model(X_test,y_test)
-    test_losses.append(loss.data)
-    # 学習過程を出力
-    if epoch % 10 == 0:
-        print("epoch: {}/{} train loss: {} test loss: {}".format(epoch, n_epoch, average_loss, loss.data))
 # 検証
@@ -218,4 +14,24 @@
 ```
+# 質問:一つ教えていただけますか？
+Chainerで電気需要予測モデルを作っているのですが、
-# 質問:上記を実行するとtrain lossとtest lossがnanになり、X_testの中身はマイナス数値になります。また、検証でグラフを表示するとy_pred.arrayのグラフのみ表示されません。どなたか教えていただけますか？
+学習モデルを作成後下記の予測値取得コード＆グラフ作成でエラーメッセージは出ないですが、なぜか「y_pred」グラフのみ表示されません。調べてみるとy_predの中身が
+array([[nan],
+       [nan],
+       [nan],
+       ...,
+       [nan],
+       [nan],
+       [nan]], dtype=float32)
+になっています。原因はどこにあると思いますか？