架空の人物の顔画像を生成するStyle GANには、スタイル入力を行うadaptive instance normalization(AdaIN)という入力層があります。
この入力データについて、次のURLに詳しい説明が記載されています。
https://qiita.com/Hiroaki-K4/items/bd4ea4e74200cbd277de
また、ここでの説明として、次の記述があります。
ここでは、adaptive instance normalization(AdaIN)と呼ぶ、INのシンプルな拡張を提案します。 AdaINはコンテンツ入力xとスタイル入力yを受け取り、xのチャネルごとの平均と分散を調整して、yのそれらと一致させます。 BN、IN、CINとは異なり、AdaINには学習可能なaffine parameterはありません。 代わりに、スタイル入力からaffine parameterを計算します。正規化されたコンテンツ入力をσ(y)でシンプルにスケーリングし,それをμ(y)でシフトしています。
この説明によると、スタイル入力yを受け取った後は、平均と分散を求めてコンテンツ入力をσ(y)でシンプルにスケーリングとμ(y)でシフトしているだけのように見えます。
つまり、スタイル入力yのベクトル値が無視され、分布(σ(y)とμ(y))のみに意味を持たせているようなのですが、その理解で合ってますでしょうか。
よろしくお願いします。
あなたの回答
tips
プレビュー