回答編集履歴

修正

2017/11/09 16:46

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -7,8 +7,8 @@
 詳しくはコードを追っていただくとして、ポイントをいくつかだけ。
 0. おそらくオリジナルのコードで一番問題となったのは教師データをシャッフルしていないことだと思います。エポックごとにシャッフルすべきです。
 1. 学習ではlossが小さくなるように重みを更新します。なので、学習率次第ではaccuracyははじめのうちは変化しません。それに対して、lossが先が変動します。（学習している証拠です。）これを出力すべきです。今回の場合はtensorflowの泥臭いところを全部自分で書きたい（のかもしれない）ので、もとのコードに修正を加えましたが、Kerasなどの高度なライブラリを使うことで、デフォルトでaccuracyとlossの両方を出力させることができます。
-2. cross_entropyの計算が正しくありませんでした。[本家](https://www.tensorflow.org/get_started/mnist/beginners)のチュートリアルを参考にするとよいのですが、reduction_indices=[1]が欠けているせいで、一定の精度以上学習できません。またyの値のクリッピングも学習にバイアスをあたえるので、ない方がよいです。理由はyが1以上であれば、みなlossがおなじになるので重みを更新しようがないことが挙げられます。
-3. lossを出力させていないことにもつながりますが、重みの初期化次第ではlossがnanになることがあります。このような場合も学習することはできません。
+2. cross_entropyの計算が正しくありませんでした。[本家](https://www.tensorflow.org/get_started/mnist/beginners)のチュートリアルを参考にするとよいのですが、reduction_indices=[1]が欠けているせいで、一定の精度以上学習できません。（追記：[勾配に対してclipをつけろと言われていますね](https://stackoverflow.com/questions/36498127/how-to-effectively-apply-gradient-clipping-in-tensor-flow)。またyの値のクリッピングも学習にバイアスをあたえるので、ない方がよいです。理由はyが1以上であれば、みなlossがおなじになるので重みを更新しようがないことが挙げられます。）
+3. lossを出力させていないことにもつながりますが、重みの初期化次第ではlossがnanになることがあります。このような場合も学習することはできません。（追記：lossがnanになるのはyの値をclipしていないことによるようですね。）
 4. 画像取り込みのpathに関するバグを修正しました。
 5. 以前の回答でも指摘した、conv2d_firstのカッコの閉じる場所を修正しました。
 6. 以前の回答の最後のコードのインデントが正しくなかった箇所を修正しました。

改善

2017/11/09 16:46

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -1,6 +1,6 @@
 確実に学習したというモデルを上げておきます。
 手元のパソコンにとってAlexNetは非常に重いので、いたるところでパラメータが縮小されています。
-少なくとも有名なKaggleの犬猫分類に対して判定精度99％を超えることができます。
+少なくとも有名なKaggleの犬猫分類に対して判定精度99%（追記：教師データに対して100%に過学習できるほど学習できる……このパラメータではテストデータに対しては70%程度ですね。）を超えることができます。
 犬猫分類のパラメータなので、2値分類です。
 多クラスに使う場合は修正を忘れずに。

修正の反映

2017/11/09 10:25

投稿

mkgrei

スコア8562

answer CHANGED Viewed

@@ -11,7 +11,8 @@
 3. lossを出力させていないことにもつながりますが、重みの初期化次第ではlossがnanになることがあります。このような場合も学習することはできません。
 4. 画像取り込みのpathに関するバグを修正しました。
 5. 以前の回答でも指摘した、conv2d_firstのカッコの閉じる場所を修正しました。
-6. 以前の回答の最後のコードのインデントが正しくない
+6. 以前の回答の最後のコードのインデントが正しくなかった箇所を修正しました。
 ```python
 import sys
 import cv2
@@ -34,8 +35,7 @@
 flags.DEFINE_float('learning_rate', 0.001, 'Initial learning rate.')
 def inference(images_placeholder, keep_prob):
-    def weight_variable(shape,num):
+    def weight_variable(shape, num):
-        #initial = tf.truncated_normal(shape, stddev=0.1/math.sqrt(float(num)))
         initial = tf.truncated_normal(shape, stddev=0.1, mean=0.)
         return (tf.Variable(initial).initialized_value())
@@ -49,11 +49,6 @@
     def conv2d(x,W):
         return (tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME'))
-    '''
-    def max_pool_3x3(x):
-        return tf.nn.max_pool(x, ksize=[1, 3, 3, 1],
-                              strides=[1, 2, 2, 1], padding='SAME')
-    '''
     def max_pool_2x2(x):
         return tf.nn.max_pool(x, ksize=[1, 2, 2, 1],
                               strides=[1, 2, 2, 1], padding='SAME')
@@ -119,8 +114,6 @@
     return y_conv
 def loss(logits, labels):
-    #cross_entropy = tf.reduce_mean(-tf.reduce_sum(labels*tf.log(tf.clip_by_value(logits,1e-10,1.0))))
-    #cross_entropy = tf.reduce_mean(-tf.reduce_sum(labels*tf.log(tf.clip_by_value(logits,1e-10,1.0)), reduction_indices=[1]))
     cross_entropy = tf.reduce_mean(-tf.reduce_sum(labels*tf.log(logits), reduction_indices=[1]))
     tf.summary.scalar("cross_entropy", cross_entropy)
@@ -231,11 +224,4 @@
     saver = tf.train.Saver()
     hoge = sess.run(tf.global_variables_initializer())
     saver.restore(sess,"model.ckpt")
-    '''
-    for i in range(len(test_image)):
-        hoge = np.argmax(logits.eval(feed_dict={images_placeholder: [test_image[i]],keep_prob: 1.0 })[0])
-        print("%s"%hoge)
-    exit()
-    '''
 ```