背景
最近この掲示板で皆さんにお伺いしながら、D-CNNの原理を初歩的に勉強した結果として、
次のような感覚を持ちました。
【1】
D-CNNでは
米、車、海藻、虎 、、、のような外観特徴が人間からすれば完全に異なるobject同士を任意に組み合わせて一つの画像カテゴリー(class)に指定してトレーニングする可能だし、任意の実数label(scalar or vector)を指定可能
{数学根拠:NNでは任意の関数を生成可能}
【2】
D-CNNでは
同一objectであっても、D-CNNにより抽出された「画像特徴data」はそのobjectが属するclassの他のメンバーの画像内容に左右され、一定ではない!
【3】
同一objectであっても、D-CNNにより抽出された「画像特徴data」はそのobjectが属するclassのlabel値に左右される (突飛!)
【4】
D-CNNは本質的にvector量子化方法の一つ。
結論
【1】
D-CNNに抽出された「画像特徴」は人間の視覚的な「画像特徴」とは全然違う概念な量であり
人工画像特徴抽出のようなvisual semantic 性を持たない。
{D-CNNに抽出された「画像特徴data」を可視化してedgeや平滑された部品をvisual的な要素に見えるのは単に元々は有意画像のため、それに対する加重平均処理(filter,所謂**「convolution」**) の結果も元の画像内容を反映しているに過ぎない }
【2】
同じclassに属するobjectであっても D-CNNによって抽出された「画像特徴」はまちまちで、全然共通性を持たない可能性が高い(可比性なし)。
【3】
D-CNNに抽出された「画像特徴data」は、「画像の固有特徴」というより、単に指定した実数画像値vector(ie.,画像)を随意に指定した実数値(class label)に射影するための数値合わせ的な結果に過ぎない==外部条件によって任意に変動する。
画像の固有特徴 : 各種moments, 輝度HIST、HOG、SIFT、topology不変量、、、
【4】
D-CNNでやっている事は本質的に、複数のdata値(説明変数・自変数)を同一関数値に変換する射影関数と同じ。。。物性的な解釈ができず、数値計算上に成り立つための仕組みに過ぎず、
関数値が同じと言っても、対応する自変数同士の間のいかなる数値関係や数値の特性及び共通性を議論するのは無意味。
即ち、人工特徴抽出の場合のように、画像特徴間の差や距離を測る事はD-CNNには通用しない。
お願い
間違った処ご指摘お願いします。
回答1件
あなたの回答
tips
プレビュー