質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.91%

Kerasでの評価関数を自作するときの引数と演算方法

受付中

回答 0

投稿

  • 評価
  • クリップ 0
  • VIEW 168

sub-ro

score 0

前提・実現したいこと

二次関数で表すことのできる物性値を用いていくつかの特徴量を計算し、
計算された特徴量と二次関数の係数3つを教師データとするような機械学習プログラムをKerasで書いています。
デフォルトでは学習するときに出力される評価関数の値は3つの係数の推定値と真値の差に関わる量になります。
しかし、本来評価したい値は二次関数の係数ではなく、二次関数のある場所での値です。
このため、評価関数の自作を行いましたがいくつか疑問点が出てきたので教えていただけるとありがたいです。

質問内容

自作してみた評価関数は”該当のソースコード”にある通りです。

評価関数として直接用いるのは4つの関数のうち1, 2番目であり、3, 4番目はデバックに用いています。
係数は学習時に標準ベクトルに規格化されているので元に戻すためにy_stdsc.inverse_transform()
を用いています。
今回は二次関数f(x)のx=100の値を評価しています。

質問1:評価関数引数におけるバッチ数について

y_true, y_predは評価関数の引数として用いるために用意された変数であり、
各バッチごとの推定対象(ここでは二次関数の3つの係数)の真値と推定値であるとKeras公式サイトなどに書かれています。
そして、それ自体は正しいだろうということがいくつかの例で真値を出力することによってわかりました。
しかし、y_true, y_predの大きさとバッチ数が一致していません。
例えば教師データとして360個のデータを用意してvalidation_split = 0.1, batch_size = 64としたとします。
すると訓練に用いる教師データのバッチ数は
360 * (1 - 0.1) / 64 = 5.1
なので5個になるはずです。
対してy_true, y_predの大きさから分かるバッチ数は4個と一致しません。
この大きさは評価関数のy_true[i][j]のiの部分を変更してエラーが出るまでの数から求めています。
この不一致が起こるのはなぜでしょうか?

質問2:評価関数内での演算の方法

評価に用いたい二次関数の値は範囲が広いため、大きい値も小さい値も同時に評価するために真値と推定値の差(fdiff)を
真値と推定値の平均(fave)で割ったものを評価対象としています。
この計算を行うとエラーは生じないのですが計算結果がおかしくなります。
二次関数の真値、推定値を表示するための自作評価関数から評価対象を計算し
(ftruemetricsとfpredmetricsを各学習ごとに保存して外部で自作評価関数Fmetricsに対応する値を計算する)、
2番目の自作評価関数が計算する評価対象と比較すると一致しません。
比較対象を二次関数の真値や推定値そのものやそれらの差や平均にすると一致します。
一致しないのはy_true, y_predから求められる量同士を掛けたり、割ったときです。
この原因はy_true, y_predから求められる量はテンソルであり、テンソルは単純に掛けたり、割ったりできないからだと思い
テンソルの要素ごとの割り算(tf.math.divide(x, y))も用いてみましたが一致しませんでした。
どのように書けば正しく計算できるのでしょうか?

関数の係数を推定対象にしているが評価対象は関数のある点での値という少々間接的なことを行っていますが
答えを教えていただけるとありがたいです。

該当のソースコード

使用言語:python

"""
評価関数定義用関数
"""
def Func(Coe_true, Coe_pred):
    xval = 100
    ftrue = (Coe_true[0] + Coe_true[1] * xval + Coe_true[2] * xval * xval)
    fpred = (Coe_pred[0] + Coe_pred[1] * xval + Coe_pred[2] * xval * xval)
    fdiff = ftrue - fpred
    fdifftest = ftrue - fpred > 0
    fave = (ftrue - fpred) / 2
    Fval = fdiff / fave
    return tf.where(fdifftest, Fval, -Fval)

"""
自作評価関数
"""
def Fmetrics(y_true, y_pred):
    Coe_true = y_stdsc.inverse_transform([y_true[0][0], y_true[0][1], y_true[0][2]])
    Coe_pred = y_stdsc.inverse_transform([y_pred[0][0], y_pred[0][1], y_pred[0][2]])
    return Func(Coe_true, Coe_pred)

"""
自作評価関数_真値表示用
"""
def ftruemetrics(y_true, y_pred):
    Coe_true = y_stdsc.inverse_transform([y_true[0][0], y_true[0][1], y_true[0][2]])
    return Coe_true[0] + Coe_true[1] * 100 + Coe_true[2] * 100 * 100


"""
自作評価関数_推定値表示用
"""
def fpredmetrics(y_true, y_pred):
    Coe_pred = y_stdsc.inverse_transform([y_pred[0][0], y_pred[0][1], y_pred[0][2]])
    return Coe_pred[0] + Coe_pred[1] * 100 + Coe_pred[2] * 100 * 100

補足情報(使用環境)

使用環境
python 3.6.10
keras 2.3.1
tensorflow 2.1.0

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

まだ回答がついていません

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.91%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る