質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1044閲覧

ウッチャンナンチャンの顔以外を読み込んだ時にその他と出力したい

gat_buster_duel

総合スコア1

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

0クリップ

投稿2021/02/02 05:10

画像認識についての質問です
AIY-VISION-KITというAIの学習ができるキットで
ウッチャン と ナンチャンの顔を識別する、というデータセットを作りましたが
ウッチャンナンチャンの顔以外の顔やモノを読み込んだときにもウッチャンかナンチャンの顔だと出力されてしまいます。


そこでウッチャンナンチャンの顔以外の顔やモノを読み込んだときは「その他」と出力したいのですが、一般的な物体識別ソフトではどう対処しているのでしょうか?

ウッチャンナンチャンの顔以外の顔やモノを大量に学習させればよいのですか?

抽象的な質問ですいません

68user👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

plasticgrammer

2021/02/02 07:46

AIY-VISION-KITがどのようなものかわかっていませんが、クラスを分類するのみなのでしょうか? 確率のようなものはわかったりしませんか? 浅い知識で一般的かどうかはわかりませんが、確率のしきい値を決めて判別するのではと思います。 確度がいずれも90%未満ならその他とするとか。
gat_buster_duel

2021/02/04 01:48

なるほど! しきい値以下の確率だったら違う。と割り切るんですね VISION-KITでも取り込んだ画像の確率とクラス名が出力されます たしかに、この方法なら簡単に実装できそうです。ありがとうございます
guest

回答1

0

ベストアンサー

「その他」を識別する、と考えると悩ましく思ってしまいますが、分類問題であることに立ち返るとよいです。
すなわち、以下のように考えます。

  • 画像を3つのクラスA、B、Cに分類する
  • 正解ラベルとしてウッチャン画像にはA、ナンチャン画像にはB、その他の画像にはCを付与する
  • 各クラスの画像をなるべく多く学習させる

なお、学習データ・テストデータともに、各クラスでの数の大きな偏りが無いことが望ましいです。

補足追記です。

最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして単純には数100万枚〜数1000万枚を用意する必要があります(データ拡張とか、やりようはありますが)。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。

投稿2021/02/02 11:19

編集2021/02/04 22:44
toast-uz

総合スコア3266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

gat_buster_duel

2021/02/04 01:38

回答ありがとうございます。 やはりその他クラス(C)には、ウッチャンナンチャンの顔以外の画像を用意する必要があるということでしょうか?間違っていたらすいません
toast-uz

2021/02/04 03:54 編集

まず最終的に推論したい状況を決めてください。乗り物とウッチャンナンチャンを区別したいのか、犬猫含む画像からウッチャンナンチャンを区別したいのか、お笑い芸人名鑑?からウッチャンナンチャンを区別したのか、そういった推論したい状況を明確に決めて、それを代表するような学習データを用意し、その中でウッチャンとナンチャンとその他のラベルを当てはめて学習します。 推論したい状況が変わったら、学習データの選定からやりなおして、学習をしなおす必要があります。 あらゆる写真の中からウッチャンナンチャンを区別したい、という問題設定だと、何十万もの写真を学習させて、といったことが必要です。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問