回答編集履歴

完全なパラメータの追記

2017/11/27 01:14

投稿

yag1kaz

スコア253

answer CHANGED Viewed

@@ -147,30 +147,6 @@
 追記３（2017/11/20 19:25）
 上記は2値入力でしたので4値入力でうまくいくパターンを見つけましたので、追記しておきます。
-```Python
-    X = numpy.array([[0, 0, 0, 0], [0, 0, 0, 1], [0, 0, 1, 0],[0, 0, 1,1],  # 入力の記号：0がマイナス、1がプラス
-                     [0, 1, 0, 0], [0, 1, 0, 1], [0, 1, 1, 0], [0, 1, 1, 1],
-                     [1, 0, 0, 0], [1, 0, 0, 1], [1, 0, 1, 0], [1, 0, 1, 1],
-                     [1, 1, 0, 0], [1, 1, 0, 1], [1, 1, 1, 0], [1, 1, 1, 1]])
-    T = numpy.array([[1, 0, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0],  # 答えの符号:1個目が1ならプラス、
-                     [0, 1, 0, 0], [1, 0, 0, 0], [1, 0, 0, 0], [0, 1, 0, 0],  #            2個目が1ならマイナス
-                     [0, 1, 0, 0], [1, 0, 0, 0], [1, 0, 0, 0], [0, 1, 0, 0],
-                     [1, 0, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0]])
-    # X = numpy.array([[0, 0], [0, 1], [1, 0], [1, 1]])  # 入力の記号：0がマイナス、1がプラス
-    # T = numpy.array([[1, 0], [0, 1], [0, 1], [1, 0]])  # 答えの符号:1個目が1ならプラス、2個目が1ならマイナス
-    N = X.shape[0]  # number of data
-    input_size = X.shape[1]
-    hidden_size = 2     # 2
-    output_size = 4     # 2
-    epsilon = 0.1       # 0.1
-    mu = 0.5            # 0.9
-    epoch = 200000       # 10000
-```
-残念ながら、[1,1,1,1]の符号判定だけは誤学習していました。パラメータとチューニングすればいけそうな感触です。
-追記４
 既に不要かもしれませんが、完全な学習ができたハイパーパラメータを記載しておきます。
 ```Python
     X = numpy.array([[0, 0, 0, 0], [0, 0, 0, 1], [0, 0, 1, 0],[0, 0, 1,1],  # 入力の記号：0がマイナス、1がプラス

正解パラメータの追加

2017/11/27 01:14

投稿

yag1kaz

スコア253

answer CHANGED Viewed

@@ -210,4 +210,40 @@
 [1 1 0 1][  5.66085770e-03   9.94336166e-01   9.33024233e-05   9.23137346e-05]1
 [1 1 1 0][  5.65317314e-03   9.94343241e-01   9.34888288e-05   9.24102042e-05]1
 [1 1 1 1][  9.91126091e-01   8.87614458e-03   2.20889172e-05   2.87712893e-05]0
-```
+```
+mkgreiさんとのコメント欄でのやり取りで、興味がでたので、XNORを出力するMLPの重み付けパラメータの一例を記載しておきます。
+入力層＋隠れ層（一層）＋出力層の形での解の一例示です。
+```
+＜イメージ図＞（※注：\はバックスラッシュ）
+入力層　隠れ層 出力層
+     (w11)
+ x1  ―  ― h1
+(w21)\  /    (v1)
+      X　　　 o1
+(w12)/  \    /(v2)
+ x2  ―  ― h2
+    (w22)
+```
+h1 = f(w11 * x1 + w12 * x2 + b1)
+h2 = f(w12 * x1 + w22 * x2 + b2)
+o1 = f(v1 * h1 + v2 * h2 + b3)
+fはシグモイド関数です。上記の形でMLPを表すことができます。
+このときにXORを実現するパラメータの組み合わせは以下です。
+w11 = 2
+w12 = 2
+w21 = -2
+w22 = -2
+b1  = -1
+b2  = 3
+v1  = -2
+v2  = -2
+b3  = 3
+ここに負数があるのでreluではだめなんでしょうね。

完全収束したパラメータを追加

2017/11/25 10:08

投稿

yag1kaz

スコア253

answer CHANGED Viewed

@@ -135,7 +135,7 @@
 ```
 追記２
-手元で確認しましたら、
+手元で確認しましたら、2値入力の符号計算については、
 epsilon = 0.1
 mu = 0.5
 で10000回で良好な結果が得られました。
@@ -168,4 +168,46 @@
     epoch = 200000       # 10000
 ```
-残念ながら、[1,1,1,1]の符号判定だけは誤学習していました。パラメータとチューニングすればいけそうな感触です。
+残念ながら、[1,1,1,1]の符号判定だけは誤学習していました。パラメータとチューニングすればいけそうな感触です。
+追記４
+既に不要かもしれませんが、完全な学習ができたハイパーパラメータを記載しておきます。
+```Python
+    X = numpy.array([[0, 0, 0, 0], [0, 0, 0, 1], [0, 0, 1, 0],[0, 0, 1,1],  # 入力の記号：0がマイナス、1がプラス
+                     [0, 1, 0, 0], [0, 1, 0, 1], [0, 1, 1, 0], [0, 1, 1, 1],
+                     [1, 0, 0, 0], [1, 0, 0, 1], [1, 0, 1, 0], [1, 0, 1, 1],
+                     [1, 1, 0, 0], [1, 1, 0, 1], [1, 1, 1, 0], [1, 1, 1, 1]])
+    T = numpy.array([[1, 0, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0],  # 答えの符号:1個目が1ならプラス、
+                     [0, 1, 0, 0], [1, 0, 0, 0], [1, 0, 0, 0], [0, 1, 0, 0],  #            2個目が1ならマイナス
+                     [0, 1, 0, 0], [1, 0, 0, 0], [1, 0, 0, 0], [0, 1, 0, 0],
+                     [1, 0, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0]])
+    # X = numpy.array([[0, 0], [0, 1], [1, 0], [1, 1]])  # 入力の記号：0がマイナス、1がプラス
+    # T = numpy.array([[1, 0], [0, 1], [0, 1], [1, 0]])  # 答えの符号:1個目が1ならプラス、2個目が1ならマイナス
+    N = X.shape[0]  # number of data
+    input_size = X.shape[1]
+    hidden_size = 6     # 2
+    output_size = 4     # 2
+    epsilon = 0.3       # 0.1
+    mu = 0.5            # 0.9
+    epoch = 100000       # 10000
+```
+学習結果は以下となります。
+```
+[0 0 0 0][ 0.9946526   0.00533347  0.00283314  0.00259751]0
+[0 0 0 1][  3.35769941e-03   9.96644302e-01   5.56622699e-04   6.70592964e-04]1
+[0 0 1 0][  3.33927080e-03   9.96660884e-01   5.59857461e-04   6.70702223e-04]1
+[0 0 1 1][  9.96596879e-01   3.40821671e-03   2.22956843e-04   3.25614771e-04]0
+[0 1 0 0][  3.27048326e-03   9.96728618e-01   5.64677142e-04   6.74756067e-04]1
+[0 1 0 1][  9.96570795e-01   3.43393502e-03   2.23697557e-04   3.26314940e-04]0
+[0 1 1 0][  9.96504986e-01   3.49893558e-03   2.25097803e-04   3.27462076e-04]0
+[0 1 1 1][  5.66155206e-03   9.94335298e-01   9.34340392e-05   9.24230822e-05]1
+[1 0 0 0][  3.31009107e-03   9.96690587e-01   5.56904682e-04   6.68238304e-04]1
+[1 0 0 1][  9.96573108e-01   3.43220946e-03   2.22530928e-04   3.25064048e-04]0
+[1 0 1 0][  9.96511494e-01   3.49322967e-03   2.23526919e-04   3.25795278e-04]0
+[1 0 1 1][  5.66332128e-03   9.94333992e-01   9.32042942e-05   9.22570059e-05]1
+[1 1 0 0][  9.96481951e-01   3.52230033e-03   2.24429722e-04   3.26645683e-04]0
+[1 1 0 1][  5.66085770e-03   9.94336166e-01   9.33024233e-05   9.23137346e-05]1
+[1 1 1 0][  5.65317314e-03   9.94343241e-01   9.34888288e-05   9.24102042e-05]1
+[1 1 1 1][  9.91126091e-01   8.87614458e-03   2.20889172e-05   2.87712893e-05]0
+```

4値入力である程度うまくいくパターンを記載

2017/11/22 01:59

投稿

yag1kaz

スコア253

answer CHANGED Viewed

@@ -142,4 +142,30 @@
 [0 0][ 0.94077065  0.05854585]0
 [0 1][ 0.05252437  0.94818359]1
 [1 0][ 0.05249829  0.94820941]1
-[1 1][ 0.94447755  0.05472062]0
+[1 1][ 0.94447755  0.05472062]0
+追記３（2017/11/20 19:25）
+上記は2値入力でしたので4値入力でうまくいくパターンを見つけましたので、追記しておきます。
+```Python
+    X = numpy.array([[0, 0, 0, 0], [0, 0, 0, 1], [0, 0, 1, 0],[0, 0, 1,1],  # 入力の記号：0がマイナス、1がプラス
+                     [0, 1, 0, 0], [0, 1, 0, 1], [0, 1, 1, 0], [0, 1, 1, 1],
+                     [1, 0, 0, 0], [1, 0, 0, 1], [1, 0, 1, 0], [1, 0, 1, 1],
+                     [1, 1, 0, 0], [1, 1, 0, 1], [1, 1, 1, 0], [1, 1, 1, 1]])
+    T = numpy.array([[1, 0, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0],  # 答えの符号:1個目が1ならプラス、
+                     [0, 1, 0, 0], [1, 0, 0, 0], [1, 0, 0, 0], [0, 1, 0, 0],  #            2個目が1ならマイナス
+                     [0, 1, 0, 0], [1, 0, 0, 0], [1, 0, 0, 0], [0, 1, 0, 0],
+                     [1, 0, 0, 0], [0, 1, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0]])
+    # X = numpy.array([[0, 0], [0, 1], [1, 0], [1, 1]])  # 入力の記号：0がマイナス、1がプラス
+    # T = numpy.array([[1, 0], [0, 1], [0, 1], [1, 0]])  # 答えの符号:1個目が1ならプラス、2個目が1ならマイナス
+    N = X.shape[0]  # number of data
+    input_size = X.shape[1]
+    hidden_size = 2     # 2
+    output_size = 4     # 2
+    epsilon = 0.1       # 0.1
+    mu = 0.5            # 0.9
+    epoch = 200000       # 10000
+```
+残念ながら、[1,1,1,1]の符号判定だけは誤学習していました。パラメータとチューニングすればいけそうな感触です。

Python2->3対応分の修正とPython3で良好な結果を得るためのパラメータ検証の追記

2017/11/20 10:31

投稿

yag1kaz

スコア253

answer CHANGED Viewed

@@ -128,8 +128,18 @@
         y = Y[i, :]
         c = C[i]
-        print x
+        print(x)
-        print y
+        print(y)
-        print c
+        print(c)
-        print ""
+        print("")
-```
+```
+追記２
+手元で確認しましたら、
+epsilon = 0.1
+mu = 0.5
+で10000回で良好な結果が得られました。
+[0 0][ 0.94077065  0.05854585]0
+[0 1][ 0.05252437  0.94818359]1
+[1 0][ 0.05249829  0.94820941]1
+[1 1][ 0.94447755  0.05472062]0

実際のサンプルコードが存在するサイトへのリンクとサンプルコードを追記しました。

2017/11/20 05:08

投稿

yag1kaz

スコア253

answer CHANGED Viewed

@@ -1,3 +1,135 @@
 mkgreiさんの答えにヒントを得ていますが、入力値の符号を取り出して、答えの符号だけを目的関数とする学習器を別に用意させることで解決できそうです。
-同一NNの各層に追加の符号学習専用の入力層、中間層、出力層を用意する、といいかえてもよいと思います。
+同一NNの各層に追加の符号学習専用の入力層、中間層、出力層を用意する、といいかえてもよいと思います。
+＜追記＞
+以下の記事が参考になると思います。
+https://qiita.com/ta-ka/items/bcdfd2d9903146c51dcb
+リンク先ページの削除されていると参考にできなくなるとおもいますので、コード部分のみ転記しておきます。（記載先の例で示されている学習率で十分かどうかは確認をお願いいたします。）
+neuralnetwork.py
+```python
+import numpy
+import math
+import random
+from matplotlib import pyplot
+class Neural:
+    # constructor
+    def __init__(self, n_input, n_hidden, n_output):
+        self.hidden_weight = numpy.random.random_sample((n_hidden, n_input + 1))
+        self.output_weight = numpy.random.random_sample((n_output, n_hidden + 1))
+        self.hidden_momentum = numpy.zeros((n_hidden, n_input + 1))
+        self.output_momentum = numpy.zeros((n_output, n_hidden + 1))
+# public method
+    def train(self, X, T, epsilon, mu, epoch):
+        self.error = numpy.zeros(epoch)
+        N = X.shape[0]
+        for epo in range(epoch):
+            for i in range(N):
+                x = X[i, :]
+                t = T[i, :]
+                self.__update_weight(x, t, epsilon, mu)
+            self.error[epo] = self.__calc_error(X, T)
+    def predict(self, X):
+        N = X.shape[0]
+        C = numpy.zeros(N).astype('int')
+        Y = numpy.zeros((N, X.shape[1]))
+        for i in range(N):
+            x = X[i, :]
+            z, y = self.__forward(x)
+            Y[i] = y
+            C[i] = y.argmax()
+        return (C, Y)
+    def error_graph(self):
+        pyplot.ylim(0.0, 2.0)
+        pyplot.plot(numpy.arange(0, self.error.shape[0]), self.error)
+        pyplot.show()
+# private method
+    def __sigmoid(self, arr):
+        return numpy.vectorize(lambda x: 1.0 / (1.0 + math.exp(-x)))(arr)
+    def __forward(self, x):
+        # z: output in hidden layer, y: output in output layer
+        z = self.__sigmoid(self.hidden_weight.dot(numpy.r_[numpy.array([1]), x]))
+        y = self.__sigmoid(self.output_weight.dot(numpy.r_[numpy.array([1]), z]))
+        return (z, y)
+    def __update_weight(self, x, t, epsilon, mu):
+        z, y = self.__forward(x)
+        # update output_weight
+        output_delta = (y - t) * y * (1.0 - y)
+        _output_weight = self.output_weight
+        self.output_weight -= epsilon * output_delta.reshape((-1, 1)) * numpy.r_[numpy.array([1]), z] - mu * self.output_momentum
+        self.output_momentum = self.output_weight - _output_weight
+        # update hidden_weight
+        hidden_delta = (self.output_weight[:, 1:].T.dot(output_delta)) * z * (1.0 - z)
+        _hidden_weight = self.hidden_weight
+        self.hidden_weight -= epsilon * hidden_delta.reshape((-1, 1)) * numpy.r_[numpy.array([1]), x]
+        self.hidden_momentum = self.hidden_weight - _hidden_weight
+    def __calc_error(self, X, T):
+        N = X.shape[0]
+        err = 0.0
+        for i in range(N):
+            x = X[i, :]
+            t = T[i, :]
+            z, y = self.__forward(x)
+            err += (y - t).dot((y - t).reshape((-1, 1))) / 2.0
+        return err
+```
+main.py
+```python
+from neuralnetwork import *
+if __name__ == '__main__':
+    X = numpy.array([[0, 0], [0, 1], [1, 0], [1, 1]])
+    T = numpy.array([[1, 0], [0, 1], [0, 1], [1, 0]])
+    N = X.shape[0] # number of data
+    input_size = X.shape[1]
+    hidden_size = 2
+    output_size = 2
+    epsilon = 0.1
+    mu = 0.9
+    epoch = 10000
+    nn = Neural(input_size, hidden_size, output_size)
+    nn.train(X, T, epsilon, mu, epoch)
+    nn.error_graph()
+    C, Y = nn.predict(X)
+    for i in range(N):
+        x = X[i, :]
+        y = Y[i, :]
+        c = C[i]
+        print x
+        print y
+        print c
+        print ""
+```