現在、「はじめてのパターン認識」を読んでいるのですが、タイトルにも示した通り、∂(交差エントロピー誤差)/∂(重み)=0の解(重み)がなぜ交差エントロピー誤差を最小にする重みとなると言ってよいのかがわかりません。
(書籍には「解析的に解を求めることはできないので、最急降下法やニュートン・ラフソン法などで数値的に解を求める」と書かれています。)
交差エントロピー誤差関数の式を見る限り、重みを変数として見た場合2次関数のように下向きに凸の形を取らず、「極小値をとる点で傾きが0になる」という考えを当てはめることはできないように思えます。
ご回答宜しくお願い致します。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/03/26 15:08
2021/03/27 13:31
2021/03/30 07:38 編集
2021/03/30 08:03