oookabe様の質問記事【D-CNNの画像特徴抽出に対する誤解?】
(https://teratail.com/questions/118130)の中に下記内容が書かれました:
【2】 D-CNNでは同一objectであっても、D-CNNにより抽出された「画像特徴data」はそのobjectが属するclassの他のメンバーの画像内容に左右され、一定ではない!
【3】 D-CNNでは同一objectであっても、D-CNNにより抽出された「画像特徴data」はそのobjectが属するclassのlabel値に左右される (突飛!)
自分も少し画像特徴抽出するような仕事を担当した事がありますが、
D-CNNによる"特徴抽出"の性格は本当に【2】と【3】に指摘された通りのもんであれば、
それこそ『自動特徴抽出』と『人工特徴抽出』との本質的な違いだと考えて宜しいでしょうか。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
2
私がこの命題の主張を誤解している可能性にとりあえず言及してから。
objectが例えば一枚の画像だと想定しているのなら、変わるべきではありません。
ただ今の技術で、使い方を間違えると変わりうる操作が2つあります。
DropoutとBatchNormalizationです。
Dropoutを使っていて、同じ画像の予測値が毎回変わる場合、ボルツマンマシンなどという特殊なモデルの場合を除いて、使い方が間違っています。
BatchNormalizationの場合も同様のことが言えると思います。詳細についてはこれらのキーワードで調べて見てください。
そうでない場合、DNNはただの掛け算と足し算、たまに確定的な条件分岐なので一意に決まらない理由がありません。
文の別の解釈
特徴量を畳み込みのフィルタとして想定しているのであれば教師データの全体に依存しています。
分類は区別することなので、自分だけでなく、周りのものに依存して特徴は抽出されるべきです。
これは人間も同じです。
人物を学習するのなら顔に重点を置きますし、人と動物の分類なら骨格を見ます。
3
ラベル値に意味があるのなら依存して正しいです。
例えば好感度を離散的に「好き」、「中立」、「嫌い」としていて、これを1、2、3にエンコードしているのであれば微妙に好きみたいなものをあり得るので問題ありません。
そうでないのならエンコードの仕方を間違っています。
例えば「犬」、「猫」、「うさぎ」を1、2、3にエンコードする場合です。
これだと犬とうさぎの間のものが猫になります。
「label値」というのがメタ的な意味の場合、人間の思い込みについて考える必要があります。
例えば人を認識するモデルを作ろうとして、AさんとBさんの写真を集めました。
分類のラベルとしてそれぞれ2つのバイナリのカテゴリが作れます。
でもこの2人ではない写真があったときにどちらかに勝手に分類されてはまずいと思い、CさんとDさんの写真も集め、これらを1つのバイナリカテゴリとしました。
これによって作ったモデルにEさんの写真を判定してもらいました。
意図としてはAさんでもBさんでもないので、その他のCDさんカテゴリに分類して欲しいです。
が例えばAさんだと認識しました。
思い返してみれば、AEさんは女性で、BCDさんは男性でした。
すると、なんとこのモデル、女性をAに、男性をBかCDに分類するものだったのです。
教師データの時点でモデル化する際の諸々の要素について思いを馳せなければなりません。
人間の思い込みをどうすればうまく学習させることをいつも考えらければなりません。
それがモデリングというものなのです。
これら人間と機械の差ではありません。
ロジックが正しいか正しくないかの差です。
人間には無意識な偏見、使用言語からくる束縛などがあります。
これは人間的な問題で、機械の方がずっと素直なのです。
さてそうすると最後の「本質」とは何かということですが…
人間の直感で作られたか、数値的最適化で自動的に作られたかについては、確かにある意味では「本質」ではありますが、何も言っていないようにも思います。
それがまさにそれぞれの特徴量であるからです。
投稿2018/03/21 04:24
総合スコア8560
0
横から失礼します。
自分出した掲示に関わりがあるようで、一つの問題を提示し、皆さんのご意見をお伺いしたいです。
何がobjectの特徴であるかは確かにテーマや見る角度によって違ってくると思います。
ただ、どの見る角度であれ、その特徴はそのもの固有的であるかどうかに関する判断基準は唯一だと思います。
例えば、単語の文字列(string)から色々算法でハッシュコードを生成できます。
そして、時々内包的にも外延的にも共通性がない単語に対して同じハッシュコードが生成されます。
この場合、同じハッシュコードを持つ単語に必ず『本質的な共通性』を持っているとは言えるのでしょうか。
私は"言えない"と感じますが、皆さんはどう思われるのでしょうか。
それに、人間に意味のある『本質的な共通性』ではない『本質的な共通性』もあれば、もはや人間にとって意味がないではないでしょうか。
これは自分がDeep CNNによる「自動抽出」された「画像の特徴データ」に関する認識です。
★ 要は**"Deep CNNがobjectの特徴を自動的に抽出してくれる"というような表現や言い方に非常に欺瞞性を感じます。何故ならば、Deep CNNに抽出された「objectの特徴」は人間にとってどころか、同じ類の他のDeep CNNにとっても全然意味のない**データです。
投稿2018/03/22 15:56
編集2018/03/22 16:23総合スコア126
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/03/23 05:25 編集
2018/03/23 06:36
2018/03/23 14:33 編集
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/03/21 15:28 編集
2018/03/21 14:30
2018/03/22 04:27 編集
2018/03/22 15:25
2018/03/24 09:53
2018/03/25 03:52