質問編集履歴

やってみたことの追加

2017/05/25 06:36

投稿

AltT

スコア7

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -84,14 +84,6 @@
-def predict_one(w, phi):
-    score = np.dot(w, phi)
-    return (1 if score > 0 else -1)
 def forward_nn(net, phi0):
     phi_list = [phi0, "*", "*"]
@@ -250,6 +242,198 @@
 変数の更新が行われないです
+（追記）テストを行わずに学習だけ行うといったこと、つまり
+```
+# -*- coding utf-8 -*-
+from collections import defaultdict
+import math
+import numpy as np
+def word2id(input_file):
+    ids = defaultdict(lambda: len(ids))
+    for line in input_file:
+        y, x = line.rstrip().split('\t')
+        words = x.split()
+        for word in words:
+            ids["UNI:" + word]
+    return ids
+def word2id_test(ids, line):
+    words = line.rstrip().split()
+    for word in words:
+        ids["UNI:" + word]
+def create_feature(x, ids):
+    phi = [0] * len(ids)
+    words = x.rstrip().split()
+    for word in words:
+        phi[ids["UNI:" + word]] += 1
+    return phi
+def forward_nn(net, phi0):
+    phi_list = [phi0, "*", "*"]
+    for i, layer in enumerate(net):
+        w = layer["w"]
+        b = layer["b"]
+        phi_list[i + 1] = np.tanh(np.dot(w, phi_list[i]) + b)
+    return phi_list
+def backward_nn(net, phi, y):
+    J = len(net)
+    delta = [0, 0, np.array([y - phi[J][0]])]
+    delta_prime = [0] * (J + 1)
+    for i in range(J - 1, 0, -1):
+        delta_prime[i + 1] = delta[i + 1] * (1 - pow(phi[i + 1], 2))
+        w = net[i]["w"]
+        b = net[i]["b"]
+        delta[i] = np.dot(delta_prime[i + 1], w)
+    return delta_prime
+def update_weights(net, phi, delta_prime, _lambda):
+    for i in range(len(net) - 1):
+        w = net[i]["w"]
+        b = net[i]["b"]
+        w += _lambda * np.outer(delta_prime[i + 1], phi[i])
+        b += _lambda * delta_prime[i + 1]
+if __name__ == "__main__":
+    input_file = open('data/titles-en-train.labeled')
+    test_file = open("data/titles-en-test.word")
+    ans_file = open('data/titles-en-test.labeled')
+    ids = word2id(input_file)
+    for line in test_file:
+        word2id_test(ids, line)
+    input_file.seek(0)
+    test_file.seek(0)
+    feat_lab = []
+    for line in input_file:
+        y, x = line.rstrip().split('\t')
+        phi = create_feature(x, ids)
+        feat_lab.append((phi, float(y)))
+    net = [{"w": np.random.rand(2, len(ids)) - 0.5, "b": np.random.rand(2) - 0.5}, {"w": np.random.rand(1, 2) - 0.5, "b": np.random.rand(1) - 0.5}]
+    print(net)
+    ans_file = open("data/titles-en-test.labeled")
+    iterations = 5
+    #学習する
+    for i in range(iterations):
+        c = 0
+        num = 0
+        test_file.seek(0)
+        ans_file.seek(0)
+        for phi, y in feat_lab:
+            phi_list = forward_nn(net, phi)
+            delta_prime = backward_nn(net, phi_list, y)
+            update_weights(net, phi, delta_prime, 0.1)
+```
+のような場合はしっかりとnetの値は更新されます
+そのため、このコード以外の場所に問題があると考えました
 ###補足情報(言語/FW/ツール等のバージョンなど)

コードの間違いがあったので修正しました

2017/05/25 06:36

投稿

AltT

スコア7

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -220,9 +220,7 @@
             delta_prime = backward_nn(net, phi_list, y)
-            if (phi_list[len(phi_list) - 1][0] < 0 and float(y) == 1) or (phi_list[len(phi_list) - 1][0] > 0 and float(y) == -1):
-                update_weights(net, phi_list, delta_prime, 0.1)
+            update_weights(net, phi, delta_prime, 0.1)

細かい修正

2017/05/25 05:28

投稿

AltT

スコア7

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -26,7 +26,7 @@
 一回実行してみるとよく分かります
-まずnetには各層の重みベクトル、cにはテストケースにおける二元符号{1, -1}のうちの1が出てくる回数が,numにはテストケースを実行した際の結果で0よりも大きくなる場合をカウントしています。1回目はcとnumの二つの値が各回数分変更がかかり数字が更新されます。netもupdate_weights関数によって変更が加えられ値の更新が行われます。ですが、2回目からどの変数の値も変わらず、何度やっても結果は1回目のものから変わらなくなってしまいます。
+まずnetには各層の重みベクトル、cにはテストケースにおける二元符号{1, -1}のうちの1が出てくる回数が,numにはテストケースを実行した際の結果で0よりも大きくなる場合をカウントしています。1回目はcとnumの二つの値が各回数分変更がかかり数字が更新されます。netもupdate_weightsメソッドによって変更が加えられ値の更新が行われます。ですが、2回目からどの変数の値も変わらず、何度やっても結果は1回目のものから変わらなくなってしまいます。

問題箇所の説明を追加

2017/05/24 23:13

投稿

AltT

スコア7

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -26,6 +26,10 @@
 一回実行してみるとよく分かります
+まずnetには各層の重みベクトル、cにはテストケースにおける二元符号{1, -1}のうちの1が出てくる回数が,numにはテストケースを実行した際の結果で0よりも大きくなる場合をカウントしています。1回目はcとnumの二つの値が各回数分変更がかかり数字が更新されます。netもupdate_weights関数によって変更が加えられ値の更新が行われます。ですが、2回目からどの変数の値も変わらず、何度やっても結果は1回目のものから変わらなくなってしまいます。
 ```python
 # -*- coding utf-8 -*-
@@ -222,12 +226,6 @@
-        test_file.seek(0)
-        ans_file.seek(0)
         for line, line2 in zip(test_file, ans_file):
             phi = create_feature(line, ids)
@@ -236,8 +234,6 @@
             y, x = line2.rstrip().split('\t')
-            y = float(y)
             if float(y) == 1:
                 num += 1

タイトルの編集

2017/05/24 22:50

投稿

AltT

スコア7

test CHANGED Viewed

	@@ -1 +1 @@
1	- pythonでのファイルの読み込み、変数の値の更新が~~上手くいか~~ない
1	+ pythonでのファイル読み込み時に、変数の更新が行われない

test CHANGED Viewed

File without changes

内容の修正

2017/05/22 01:30

投稿

AltT

スコア7

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -22,6 +22,10 @@
 また、このチュートリアルには学習方法は乗っているのですがテスト方法が載っていないので自分なりの考え方でテストを行ってしまっているので間違っていたら正しい方法を教えてもらいたいです。
+（追記）後半の方にあるc,num, netといった変数が更新されません
+一回実行してみるとよく分かります
 ```python
 # -*- coding utf-8 -*-