Pythonで実装されている勾配降下法の動作がわからない（ゼロから作るディープラーニング 4.5.1）

Pythonで実装されている勾配降下法の動作がわからない

再帰関数？を使っているようなのですが、どうやって動作しているのかがわかりません。
関数numerical_gradientの動作がわかりません。

該当のソースコード

Python
1
2import sys, os
3sys.path.append(os.pardir)  # 親ディレクトリのファイルをインポートするための設定
4from common.functions import *
5from common.gradient import numerical_gradient
6
7
8class TwoLayerNet:
9    # 引数は、入力層、隠れ層、出力層のニューロン数,学習率
10    def __init__(self, input_size, hidden_size, output_size, weight_init_std=0.01):
11        # 重み,バイアスの初期化
12        self.params = {} # 重み、バイアスのパラメータを保持する辞書型の変数
13        self.params['W1'] = weight_init_std * np.random.randn(input_size, hidden_size)
14        self.params['b1'] = np.zeros(hidden_size) # ゼロで初期化
15        self.params['W2'] = weight_init_std * np.random.randn(hidden_size, output_size)
16        self.params['b2'] = np.zeros(output_size)
17        #{"W1" : (input_size,hidden_size)のnumpy配列 , "b1" : (hidden_size)のnumpy配列 , ... }
18    # 推論をする
19    def predict(self, x):
20        W1, W2 = self.params['W1'], self.params['W2']
21        b1, b2 = self.params['b1'], self.params['b2']
22    
23        a1 = np.dot(x, W1) + b1
24        z1 = sigmoid(a1)
25        a2 = np.dot(z1, W2) + b2
26        y = softmax(a2)
27        
28        return y
29        
30    # x:入力データ, t:正解ラベル(教師データ)
31    # 損失関数を求める
32    def loss(self, x, t):
33        y = self.predict(x)
34        
35        return cross_entropy_error(y, t)
36    #認識精度を求める
37    def accuracy(self, x, t):
38        y = self.predict(x)
39        y = np.argmax(y, axis=1)
40        t = np.argmax(t, axis=1)
41        
42        accuracy = np.sum(y == t) / float(x.shape[0])
43        return accuracy
44        
45    # x:入力データ, t:教師データ
46    # 重みパラメータを対する勾配(各要素を偏微分してベクトルにまとめたもの)を求める
47    def numerical_gradient(self, x, t):
48        # Wはダミーの変数
49        loss_W = lambda W: self.loss(x, t)
50        
51        grads = {}
52        # 無限ループにならない？
53        grads['W1'] = numerical_gradient(loss_W, self.params['W1'])
54        grads['b1'] = numerical_gradient(loss_W, self.params['b1'])
55        grads['W2'] = numerical_gradient(loss_W, self.params['W2'])
56        grads['b2'] = numerical_gradient(loss_W, self.params['b2'])
57        
58        return grads
59
60
61
62
63

試したこと

numerical_gradient関数の中にprintを書いて、何回printされるか試しました。
1回しかprintされず、よくわからなくなったためここで質問をしました。

補足情報（FW/ツールのバージョンなど）

「ゼロから作るディープラーニング」4.5.2 p.113~114のプログラムです。
Githubにプログラムがアップロードされており、
https://github.com/oreilly-japan/deep-learning-from-scratch/tree/master/ch04
の「two_layer_net.py」です。

初心者のため、質問内容で疑問に思ったことがあれば質問していただけると自分がわかる範囲で答えます。
よろしくお願いします。

行動規範の内容に同意します

回答1件

ベストアンサー

grads['W1'] = numerical_gradient(loss_W, self.params['W1'])は自身（メンバ関数）ではなく
from common.gradient import numerical_gradientでimportしたnumerical_gradient関数を呼んでいるため
再帰はしていません。

投稿2018/11/25 01:05