ベクトルの行列による微分

「詳解ディープラーニング第2版」のp260にある上の画像の数式の1行目が理解できません。

∂E/∂p(t)はスカラのベクトルによる偏微分なので分かるのですが、∂p(t)/∂Wはベクトルの行列による偏微分で、これの意味（定義）が分かりません。

スカラのベクトルによる偏微分は、結局そのベクトルの形状になりますが、ベクトルの行列による偏微分はどのような形状になるのでしょうか？
具体的に教えていただけると助かります。

行動規範の内容に同意します

回答1件

ベストアンサー

スカラのベクトルによる偏微分

というのが，例えば
p = [ px, py ]^t

で偏微分した結果を

∂E/∂p = [ ∂E/∂px, ∂E/∂py ]^t

として，「Eをpの各要素で偏微分した結果を，pの形に並べた物」とするのであれば，

XXX の，行列による偏微分

というのも同様にして，
「XXXを行列の各要素で偏微分した結果を，その行列の形に並べた物」とするのではないでしょうか．

なので，

∂p(t)/∂W

は，Wと同じ形の行列であり，その各要素が，pをWの各要素で偏微分した結果(ベクトル)である，ということになるのではないかと．

投稿2021/06/18 01:31

総合スコア11954

2021/06/18 06:44

回答の補足として「偏微分行列」でググると以下とかありますね。 http://www.snap-tck.com/room04/c01/matrix/matrix03.html

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問