1つ目の質問ですが、畳み込み層の計算(入力サイズと出力サイズの関係)についてです。
図6.7に関する解説に、
「つまり、入力のサイズがW×W×Kのとき、出力のサイズはW×W×Mとなる」という一文があります。
KがMになるのは理解できるのですが、出力のサイズもW×Wとなることが理解できません(出力サイズはWよりも小くなるのではないでしょうか?)入力画像に出力サイズがW×Wとなるようにあらかじめパディングが施されているのではないかと考えましたが、そうすると入力のサイズがW×Wよりも大きくなってしまうので困惑しております。この部分をどのように理解すればよいか教えていただきたいです。
2つ目の質問についてですが、畳み込みにおける勾配の計算です。
大変抽象的な質問となり申し訳ないのですが、ユニットi,j間で重みを与えるベクトルtjiを定義し、
wji=tji×h という式が出てきて以降以降、hの勾配を求める式までの流れを理解するのに苦しんでいます。
フィルターの係数hpqkmが重みwjiそのものに対応すると思っていたのですが、ここでtjiを定義してwjiを改めて求める理由は何なのでしょうか?また、そこから派生してTrという行列が出てきますが、Trがどのような行列なのか(成分数など)、Trを求める意味、そしてwの勾配とhの勾配の求め方について、理解できておりません。
根本で理解が間違っており、見当違いなことを言っている可能性もありますので、その部分も指摘していただけますと幸いです。以上2点、ご教示のほどよろしくお願いいたします。
あなたの回答
tips
プレビュー