回答編集履歴

内容の変更

2022/09/11 08:53

投稿

sigefuji

スコア127

answer CHANGED Viewed

@@ -1,6 +1,135 @@
-kerasの場合、ミニバッチごとのモデル評価の戻り値は、出力値（カテゴリごとのリスト）なので、
+その後調べた結果、モデルの出力値を取得できる方法がわかった。
-この値と教師データから、カテゴリごとの正解値を計算すればよい簡単なことがわかりました。
+出力値が取得できれば、カテゴリーごとの正解数を求めることは容易。
-質問当時はこのmodel関数（？）の戻り値がそれを表すことがわかりませんでした。
+参考書籍（下記）を参考に試した２例を参考までに掲示します。
-まったく普通の考えでした。
-よく見るサンプルプログラムは、カテゴリごとの正解値は必要とせず、単にバッチ単位での正解率だけを評価しているのでわかりませんでした。
+１．tensorflow/kerasのconv1Dモデルで学習をする場合
+全epoch終了後,model.predictを使用して、全学習サンプルの出力値を取得できる。
+この方法の問題点
+・各epoch途中の出力値は取得できず、最後のepochの値が取得できるようだ。
+・主力値の全サンプルを記憶するメモリが必要と思われる（gpuのメモリサイズに影響すると思う）
+　各ミニバッチ評価ごと、あるいはepochごとに取得できれば、最終的に必要なct/winのカテゴリ数だけのメモリで良い。
+使用コード例抜粋
+参考書籍6章１節（物体画像認識時系列データ処理入門第2版）
+```
+# 畳み込み層
+model.add(
+    Conv1D(filters=100,               # フィルターの数は32
+           kernel_size=(3),           # 3のフィルターを使用
+           padding='same',           # ゼロパディングを行う
+           input_shape=(1,xsz),      # 入力データの形状
+           activation='relu'         # 活性化関数はReLU
+           ))
+'''
+3. 学習する
+'''
+training_epochs = 100
+# 学習を行って結果を出力
+history = model.fit(
+        x_train,                   # 訓練データ
+        y_train,                   # 正解ラベル
+        epochs=training_epochs,    # 学習を繰り返す回数
+        batch_size=batch_size,     # ミニバッチのサイズ
+        verbose=0,                 # 学習の進捗状況を出力する
+        #validation_split= 0.2,     # 検証データとして使用する割合
+        shuffle=True,              # 検証データを抽出する際にシャッフルする
+        #callbacks=[early_stopping] # コールバックはリストで指定する
+        )
+# テストデータで学習を評価するデータを取得
+score = model.evaluate(x_train, y_train, verbose=1)
+print('evaluate Train loss:', score[0])       # テストデータの損失を出力
+print('Train accuracy:', score[1])   # テストデータの精度を出力
+pred_train = model.predict(x_train)  # 全訓練データの出力値を取得
+ct=[0 for n in range(p_out)]
+win=[0 for n in range(p_out)]
+for n in range(len(x_train)):　　　　　　　#　全訓練データ数でループしてct/winを積算
+    b_y = pred_train[n].argmax()
+    if b_y == y_train[n]:
+        win[b_y] += 1
+    ct[b_y] += 1
+print("train",ct)
+print("win",win)
+```
+２．MLPクラスの場合（隠れ層と出力層のみの単純な場合）
+１サンプルの学習時に呼び出す outputs = model(x, training=True) の戻り値に出力値がセットされる。
+これから普通に、最大値を選べば、予測ラベルになる。
+第1のモデルに比しての功罪
+・出力値を保存しておくメモリが不要
+次に1次元データの場合の適用例を示す
+参考書籍５章５節
+```
+'''
+2. モデルの定義
+'''
+class MLP(tf.keras.Model):
+    '''多層パーセプトロン
+    Attributes:
+      l1(Dense): 隠れ層
+      l2(Dense): 出力層
+    '''
+    def __init__(self, hidden_dim, output_dim):
+        super().__init__()
+        self.fc1 = tf.keras.layers.Dense(hidden_dim, activation='relu')
+        self.dropout = tf.keras.layers.Dropout(0.5)
+        self.fc2 = tf.keras.layers.Dense(output_dim, activation='softmax')
+    def call(self, x, training=None):
+        x = self.fc1(x) # 第1層の出力
+        if training:       # 訓練モードのときdropout
+            x = self.dropout(x)
+        x = self.fc2(x) # 出力層の出力
+        return x
+'''
+4. 勾配降下アルゴリズムによるパラメーターの更新処理を行うtrain_step()関数
+'''
+train_loss = tf.keras.metrics.Mean()
+train_accuracy = tf.keras.metrics.CategoricalAccuracy()
+def train_step(x, t):
+    '''学習を1回行う
+      Returns:
+      ステップごとのクロスエントロピー誤差
+    '''
+    with tf.GradientTape() as tape:
+        outputs = model(x, training=True)    # モデルに入力して順伝搬の出力値を取得
+        tmp_loss = loss_fn(t, outputs)    # 出力値と正解ラベルの誤差
+    grads = tape.gradient(
+        tmp_loss,     # 現在のステップの誤差
+        model.trainable_variables)
+    # 勾配降下法の更新式を適用してバイアス、重みを更新
+    optimizer.apply_gradients(zip(grads,
+                                  model.trainable_variables))
+    train_loss(tmp_loss)
+    train_accuracy(t, outputs)
+    ct=[0 for ot in range(p_out)]
+    win=[0 for ot in range(p_out)]
+    for bat in range(batch_size):
+        maxv=0
+        maxot=0
+        #print("outputs",outputs[bat,])
+        for ot in range(p_out):
+            if outputs[bat,ot] > maxv:
+                maxv = outputs[bat,ot]
+                maxot = ot
+        no = onehot2no(t[bat])
+        ct[maxot] += 1
+        if maxot==no:
+            win[maxot] += 1
+    return ct,win
+```
+参考情報：
+cpuの利用効率であるが、例１は１００％であるのに、例２はなぜか２０－４０％と低い。
+計算効率が何か異なるようだ。