Kerasの損失関数の作り方

kerasで損失関数を作りたいのですが、動きません。
全体的なアドバイスと共に、x_decoded_valueにはプログラムのどこで入力したデータが入るのか、どのようなshapeのデータなのかを教えていただきたいです。
Ck, Qy_listなどは、グローバル変数です。

python
1def compute_loss(x, x_decoded_value):
2    """ Update loss
3    Args:
4      x: input of NN
5      x_decoded_value: output of NN
6    Returns:
7      J: loss of training
8    """
9    k_nonself_dist = K.zeros(shape(len(Ck)-1))
10    J = 0
11    for i in range(50):
12        Qx_embedding = ProtNet_NN.predict(Qx[i,:], batch_size=1)
13        k_self_dist = np.linalg.norm(Qx_embedding-np.array(Ck.loc[Qy_list[i]]))
14        _tmp = np.array(Ck[Ck.index!=Qy_list[i]])
15        for j in range(len(Ck)-1):
16            k_nonself_dist[j] = np.linalg.norm(Qx_embedding-_tmp[j,:])
17        J += (k_self_dist + np.log(np.sum(np.exp(-k_nonself_dist)))) / (Nc * 50) # Update loss
18    
19    J = K.variable(J) # Tensor型に変換
20    return J

----------------追記----------------

損失関数を作る上で最低限守らなければならないことは、
① 関数内の変数は全てTensor型であること
② NNの出力層を損失関数内で用いること
でした。他にも何かありましたら追記します。

行動規範の内容に同意します

回答2件

（こちらも初心者なので、正しくないことがあったらごめんなさい）

バックエンド(K.～)の機能のみを使って、実装してみてください。
以下がその理由です。

公式の損失関数の実装を見てみると、以下のようになっております。

Python
1def mean_squared_error(y_true, y_pred):
2    return K.mean(K.square(y_pred - y_true), axis=-1)

これを見ると、「バックエンド(K.～)の関数で計算方法を定義する」形になっているので、自作する場合も同じように実装する必要があるのだと思われます。
バックエンドの関数はこちらに記載されており、importすれば自作の関数でも使うことができます。
また、モデルの計算毎に実行されるわけではないので、関数内で計算してしまうと、その値は固定値になってしまいますので、避けるべきです。

なお、y_true（x）は正解値のテンソル、y_pred（x_decoded_value）はモデルでの計算結果の値のテンソルだと思われます。

投稿2018/07/25 03:55

fiveHundred

総合スコア9805

tanshoko

2018/07/25 05:32

ご回答ありがとうございます。モデルの計算は、１epoch毎にlossを計算し、それをfor文で回して学習させます。アルゴリズムの性質上、どうしてもNumpy配列が必要なのですが、それをK.variableで覆うだけの処理だとダメなのでしょうかね...

fiveHundred

2018/07/25 06:29

> モデルの計算は、１epoch毎にlossを計算し、それをfor文で回して学習させます。よく分からないです。 fit関数かそれに近いもので学習しているのだと思っておりましたが、そうではないということでしょうか？ > アルゴリズムの性質上、どうしてもNumpy配列が必要なのですが、その理由がよく分からないのですが、それは何でしょうか？ > それをK.variableで覆うだけの処理だとダメなのでしょうかね... 前述の通り、モデルの計算毎にcompute_loss関数を呼ぶわけではないので、現状のソースだと動かないですね。（私が知らないだけで他に方法があるかもしれませんが）

tanshoko

2018/07/25 09:33 編集

>fit関数かそれに近いもので学習しているのだと思っておりましたが、そうではないということでしょうか？ fit関数を1epochで回し、例えばそれをfor文で50回ループさせることで50epoch分の学習をさせているということです。loss関数の定義上、今の私の知識ではそうなってしまいました。 >> アルゴリズムの性質上、どうしてもNumpy配列が必要なのですが、 >その理由がよく分からないのですが、それは何でしょうか？グローバル変数で定義したDataFrameの値をloss関数で使うためです。 >前述の通り、モデルの計算毎にcompute_loss関数を呼ぶわけではないので、現状のソースだと動かないですね。以下のようにしても学習毎にloss関数は呼び出されないのでしょうか? ```Python for i in range(50): # for文の中で、他に処理があります model.fit(x=Qx, batch_size=len(Qx), epochs=1, shuffle=False) ```

fiveHundred

2018/07/25 10:23

> グローバル変数で定義したDataFrameの値をloss関数で使うためです。それはどういう値でしょうか？もし正解値の場合は、後述のfit関数のyに指定し、それをy_true（x）で取得するのが正しいやり方だと思います。 > 以下のようにしても学習毎にloss関数は呼び出されないのでしょうか? 私に聞くよりもprint()で出力してみた方が早いと思います。というか、fit関数にyが指定されていませんが、正しいでしょうか？（yは正解値なので、それがないとそもそも学習できないと思いますが）

tanshoko

2018/07/25 11:12 編集

[Prototypical Netwok]　https://arxiv.org/abs/1703.05175 こちらの論文にある手法を実装したいと考えていて、現在悩んでいる損失関数はAlgorithm 1です。 >もし正解値の場合は、後述のfit関数のyに指定し、それをy_true（x）で取得するのが正しいやり方だと思います。正解というよりも、自分のクラスに属するデータの重心との距離を近くし、他のクラスのデータの重心とは距離を遠くするというNNを作るための損失関数です。 >というか、fit関数にyが指定されていませんが、正しいでしょうか？ yは指定しなくても学習できるので、問題ありません。(過去に経験済み)

fiveHundred

2018/07/25 11:12

そうだとすると、私は分からないですね…。すいません。

tanshoko

2018/07/25 11:13

わかりました。ありがとうございます。

行動規範の内容に同意します

ベストアンサー

普通KerasはTensorflowをバックエンドに持っていて、Tensorflowはpythonのネットワークを解釈してC++での実装で走ります。
それゆえ、損失関数はtf.Tensorで書かれる必要があります。

グローバル変数であっても、tf.Constantにするか、tf.Placeholderにfeedする形で与える必要があります。

投稿2018/07/25 22:27

編集2018/07/25 22:28

mkgrei

総合スコア8560

tanshoko

2018/07/26 07:45

ありがとうございます！解決しました！

oookabe

2018/07/29 03:10

mkgrei さんトピ主が分かったのに、質問したいのです。　御免なさい！＞＞Tensorflowはpythonのネットワークを解釈して.... これはどういう意味でしょうか。もしかして『計算グラフを解釈して....』という意味？どうぞ宜しくお願いします

mkgrei

2018/07/29 22:43

tensorflowのpython版がやっていることは、ニューラルネットワークの構造を定義することです。その構造のニューラルネットワークを焼き直して実際の計算はC++で行います。 https://www.tensorflow.org/guide/graphs https://www.buildinsider.net/small/booktensorflow/0001

行動規範の内容に同意します

あなたの回答