編集履歴

質問編集履歴

タイトルの変更

2019/11/23 07:51

投稿

スコア4

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~shapes (32,2) and (1,30) not aligned: 2 (dim 1) != 1 (dim 0)~~の内積計算エラーを解決したい
1	+ ニューラルネットワークに内の内積計算エラーを解決したい

body CHANGED Viewed

File without changes

該当コード、エラー内容を分かりやすくした

2019/11/23 07:51

投稿

hidekun-

スコア4

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -2,11 +2,12 @@
 ディープラーニングを用いて、道路の復旧期間日数の予測モデルを構築しています。
 説明変数6種類（道路の崩壊程度、道路盛土の高さ、崩壊車線数など）、目的変数1種類（復旧までの日数）としてニュラールネットワークを構築しています。
-そのなかで、以下のエラーメッセージが発生しました。
+そのなかで、以下の行列の内積計算エラーメッセージが発生しました。
-### 発生している問題・エラーメッセージ
+発生している問題・エラーメッセージ
 ---------------------------------------------------------------------------
+```python
 ValueError                                Traceback (most recent call last)
 <ipython-input-42-64c8b1648510> in <module>
       1 for i in range(epoch):
@@ -29,123 +30,140 @@
 ValueError: shapes (32,2) and (1,30) not aligned: 2 (dim 1) != 1 (dim 0)
+```
 ### 該当のソースコード
+```python
-import numpy as np
+import numpy as np
-import pandas as pd
+import pandas as pd
-from sklearn.model_selection import train_test_split
+from sklearn.model_selection import train_test_split
-import matplotlib.pyplot as plt
+import matplotlib.pyplot as plt
-import matplotlib.pyplot as plt
+import matplotlib.pyplot as plt
+# affine変換してる
-def affine(z, w, b):
+def affine(z, w, b):
-return np.dot(z, w) + b
+return np.dot(z, w) + b
+# affine変換勾配
+def affine_back(du, z, w, b):
+dz = np.dot(du, w.T)
+dw = np.dot(z.T, du)
+db = np.dot(np.ones(z.shape[0]).T, du)
+return dz, dw, db
+def sigmoid(u):
+return 1 / (1 + np.exp( u))
-def affine_back(du, z, w, b):
-dz = np.dot(du, w.T)
+#活性化関数 シグモイド の 勾配，中間層の勾配
-dw = np.dot(z.T, du)
-db = np.dot(np.ones(z.shape[0]).T, du)
-return dz, dw, db
-def sigmoid(u):
+def sigmoid_back(u):
-return 1 / (1 + np.exp(-u))
+return (1 sigmoid(u)) * sigmoid(u)
+def identity(u):
+return u
+#二乗和誤差：回帰問題
-def sigmoid_back(u):
+def squared_error(y, t):
-return (1 - sigmoid(u)) * sigmoid(u)
+return 0.5 * np.sum((y t) ** 2) / y.shape[0]
-def identity(u):
-return u
+#誤差 二乗和誤差）＋活性化関数 恒等関数 の勾配
+def identity_mean_s
-def squared_error(y, t):
+quared_error_back(y, t):
-return 0.5 * np.sum((y - t) ** 2) / y.shape[0]
+return (y t) / y.shape[0]
+#学習部分
+def learn(x, t, w1, b1, w2, b2, w3, b3, lr):
+#順伝播 入力データから、予測データを求めるまで
+u1 = affine(x, w1, b1)
+z1 = sigmoid(u1)
+u2 = affine(z1, w2, b2)
+z2 = sigmoid(u2)
+u3 = affine(z2, w3, b3)
+y = identity(u3)
+#逆伝播 勾配の計算を求め、重みの更新を行う部分
-def identity_mean_squared_error_back(y, t):
+dy = identity_mean_squared_error_back(y, t)
+dz2, dw3, db3 = affine_back(dy, z2, w3, b3)
+du2 = sigmoid_back(u2)
+dz1, dw2, db2 = affine_back(du2, z1, w2, b2)
-return (y - t) / y.shape[0]
+du 1 = sigmoid_back(u1)
+dx, dw1, db1 = affine_back(du1, x, w1, b1)
+#重み、バイアスの更新
+w1 = w1 lr * dw1
+b1 = b1 lr * db1
+w2 = w2 lr * dw2
+b2 = b2 lr * db2
+w3 = w3 lr * dw3
+b3 = b3 lr * db3
+return w1, b1, w2, b2, w3, b3
-def learn(x, t, w1, b1, w2, b2, w3, b3, lr):
+def predict(x, w1, b1, w2, b2, w3, b3):
+#順伝播
+u1 = affine(x, w1, b1)
+z1 = sigmoid(u1)
+u2 = affine(z1, w2, b2)
+z2 = sigmoid(u2)
+u3 = affine(z2, w3, b3)
+y = identity(u3)
+return y
-u1 = affine(x, w1, b1)
+#実行プログラム
-z1 = sigmoid(u1)
+#地震データ読み込み
-u2 = affine(z1, w2, b2)
+df = pd.read_csv('earthquake_B_traffic.csv')
-z2 = sigmoid(u2)
-u3 = affine(z2, w3, b3)
-y = identity(u3)
+# データの作成データの作成 説明変数・目的変数分ける説明変数・目的変数分ける
+df_x = df.drop("regulatory period", axis=1)
+p= df.drop("damage range", axis=1)
+q= p.drop( "embankment height", axis=1)
+r= q.drop("landform", axis=1)
+s= r.drop("banking structure", axis=1)
+t= s.drop("damage form", axis=1)
+u= t.drop("traffic", axis=1)
-dy = identity_mean_squared_error_back(y, t)
-dz2, dw3, db3 = affine_back(dy, z2, w3, b3)
-du2 = sigmoid_back(u2)
-dz1, dw2, db2 = affine_back(du2, z1, w2, b2)
+# 説明変数・目的変数をそれぞれ訓練データ・テストデータに分割説明変数・目的変数をそれぞれ訓練データ・テストデータに分割
-du1 = sigmoid_back(u1)
-dx, dw1, db1 = affine_back(du1, x, w1, b1)
+x_train, x_test, t_train, t_test = train_test_split(df_x, t, test_size=0.3)
+#ノード数設定
+d0 = x_train.shape[1]
+d1 = 30 # 1層目のノード 数
+d2 = 30 # 2層目のノード数
+d3 = 1 #出力層
-w1 = w1 - lr * dw1
+#重みの初期化 0.1 0.1 の乱数
+np.random.seed(8)
-b1 = b1 - lr * db1
+w1 = np.random.rand(d0, d1)*0.001
-w2 = w2 - lr * dw2
+w2 = np.random.rand(d1, d2)*0.001
-b2 = b2 - lr * db2
-w3 = w3 - lr * dw3
-b3 = b3 - lr * db3
-return w1, b1, w2, b2, w3, b3
+w3 = np.random.rand(d2, d3)*0.001
-def predict(x, w1, b1, w2, b2, w3, b3):
+#重みを１ ~0.001 に設定する部分
-u1 = affine(x, w1, b1)
+#バイアスの初期化 (
-z1 = sigmoid(u1)
+b1 = np.zeros(d1)
-u2 = affine(z1, w2, b2)
-z2 = sigmoid(u2)
+b2 = np.zeros(d2)
-u3 = affine(z2, w3, b3)
-y = identity(u3)
-return y
+b3 = np.z
+eros(d3)
+#学習率
-df = pd.read_csv('earthquake_B_traffic.csv')
+lr = 0.5
+#バッチサイズ
+batch_size = 32
-df_x = df.drop("regulatory period", axis=1)
-p= df.drop("damage range", axis=1)
-q= p.drop( "embankment height", axis=1)
-r= q.drop("landform", axis=1)
+#学習回数
-s= r.drop("banking structure", axis=1)
-t= s.drop("damage form", axis=1)
-u= t.drop("traffic", axis=1)
+epoch =1000
+#グラフを 描写リスト
+x = [0, epoch]
+y = [0.100]
+for i in range(epoch):
+for j in range(0, x_train.shape[0], batch_size): w1, b1, w2, b2, w3, b3 = learn(x_train[j:j + batch_size], t_train[j:j + batch_size], w1, b1, w2, b2, w3, b3,
-x_train, x_test, t_train, t_test = train_test_split(df_x, t, test_size=0.3)
+# 学習 shape[ ００ は行の大きさを調べている．ここでは， 77 ．よって 0~77 の範囲でバッチサイズ文のステップ幅で数列を作成
+```
-d0 = x_train.shape[1]
-d1 = 30 # 1 層目のノード数
-d2 = 30 # 2 層目のノード数
-d3 = 1 #出力層
-w1 = np.random.rand(d0, d1)*0.001
-w2 = np.random.rand(d1, d2)*0.001
-w3 = np.random.rand(d2, d3)*0.001
-b1 = np.zeros(d1)
-b2 = np.zeros(d2)
-b3 = np.zeros(d3)
-lr = 0.5
-batch_size = 32
-epoch =1000
-x = [0, epoch]
-y = [0.100]
-for i in range(epoch):
-for j in range(0, x_train.shape[0], batch_size): w1, b1, w2, b2, w3, b3 = learn(x_train[j:j
-+ batch_size], t_train[j:j + batch_size], w1, b1, w2, b2, w3, b3, lr)
 ### 試したこと
 説明変数の数を6種類から5種類に減らした結果、エラーの発生はなくプログラムが動きました。
 ディープラーニングを用いた文字認識のモデルのこーどを参考にしています。