皆さんお元気ですか
この間<<DNNをon line訓練したい場合の訓練データのunbalance問題>>を題した質問に
https://teratail.com/questions/117564?whotofollow=
の中の下記のような話を取り上げられました。
【実際に学習させたAIへの考察ですが、
女性の画像はかなりの確率でビルゲイツ氏かイーロンマスク氏が95%以上になり、
これは今回の学習させたデータが全員男性の顔なので、
女性の顔が渡されるとうまく判定できないけど、
とりあえず各ラベルの確率を合わせて100%にして出力しないといけないからこういう結果になるのではないかなーと推測しました。
難しい。】
もし上文の中の**「かなりの確率で」という表現は
『TEST段階で、未学習の女性画像に対しても、DNNの出力(確率分布)において突出的に高い値を持つカテゴリが現れた**』という意味であれば、
これはDNN自身の特徴を云々以前の問題ではと感じます。
自分が以下のように推測しますが、この分野のプロではないので、間違ったら、是非是非ご指摘頂きたいと思います。。
その訓練済みのDNNは
① 構造的に単に一つの「弱学習器」に過ぎないか、あるいは
② 学習したサンプルの独特的な(本質的な)特徴を身に付けていないか、
③ "過学習"の反対で-----"学習不足"か
④ "汎化性が高過ぎ"か
のいずれかが原因でしょう。
{上記理由は極一般的で,この分野において『常識的な』事かもしれませんね}
それから、ごめんなさい!
上記4つの原因を解消するために、それぞれの手法も教えてくださいませんか(指針的なものでも宜しいでございます)。
どうぞ宜しくお願い致します。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/03/18 05:56 編集
2018/03/18 06:53 編集
2018/03/18 11:19
2018/03/18 12:40
2018/03/18 14:37 編集
2018/03/18 14:39
2018/03/19 01:50