質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

3回答

681閲覧

YES/NO分類したいですけれども

leilei

総合スコア39

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

2グッド

2クリップ

投稿2018/03/16 12:27

例えば
D-CNNで日本の100円玉かどうかを判定したい場合、2値分類問題に帰着することになるかと思いますが、
日本の100円玉はデザインが固定で、製造上の変形もないので、
一枚の写真でトレーニングすれば、十分でしょうか。

それから、日本の100円玉それ以外のコイン(諸外国のコインも含む)が無数に存在するし、トレーニングできないとします。
そうすると、日本の100円玉以外のコインに対して、どうやって**"日本の100円玉以外である"**に判定させるのでしょうか。

これは片方の教師問題でもあります? セミ教師問題?

ご教授宜しくお願いします。

nijakey, IS.SEKI👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

ベストアンサー

前半の質問について

正例をひとつしか用意しない、あるいはひとつを複製したものを用意した場合、それらを使って学習した識別器は、過学習となります。つまり、画像が不鮮明、人の目ではわからない程度に対象(今回はコイン)が歪みがある、と識別器は『負である』とします。
よって、正例が唯一であっても学習には、人が正として許容するものをいろいろ用意したほうがいい感じに学習してくれます。

後半の質問について

2値分類には『Aである・Bである』と『Aである・Aではない』の二種類があります。質問のケースは後者と問題を定義したほうがいいと思います。この場合、A(日本の100円)ではないものをそれなりの数があれば、学習は可能です。識別器は未知のコインに対して、日本の100円である確率を計算し、50%を切れば『違うもの』と識別します。つまり、『このコインはフランスのものなので違うもの』という識別は行っていないということです。

投稿2018/03/16 21:39

R.Shigemori

総合スコア3376

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

IS.SEKI

2018/03/17 02:25 編集

有難うございます。 横からすみませんが、自分の感想を言わせて下さい。 R.Shigemoriさんが書かれました: 「A(日本の100円)ではないものをそれなりの数があれば、学習は可能です。」 これで一応『Aではない』に関して学習させましたね。 しかし、ここにジレンマがあります: 『Aではない』のインスタンスが無限に多いので、もしそれの一つが現れたら、『Aではない』として、学習させたことはない可能性が高いので、『Aではない』とする出力確率が50%未満になります。 同様に『Aである』でもないので、『Aである』の出力確率も50%未満であるはず。。。 こうなると、やはり第三カテゴリとしての『分からない』という分類結果があってほしいですね。
IS.SEKI

2018/03/17 02:36

>やはり第三カテゴリとしての『分からない』という分類結果があってほしいですね。 これもだめですね! 質問者の目的は『A』と『非A』だから。。。。 ごめんなさいーーー自分には出口がない~~~~
R.Shigemori

2018/03/17 03:13

IS.SEKIさん 少し勘違いがあるようです。2値分類においてsigmoid関数を使った確率の計算は、クラス1(Aである)に対して行い、クラス0(Aではない)は、全体が1.0(要は100%)なので『1.0-Aである確率』で計算します。よって、必ずどちらか一方が50%より大きい(厳密にいうと50%、50%の状況はあります)ものにあります。 つまり、未知のデータが学習時に存在したものと全く特徴の異なるものであっても学習によって得られたAである確率の計算式によって50%未満となればAではないとして処理できてしまいます。 識別器がかなりうまく完成していて、誤識別が発生するケースが0.5近辺に集中しているようであれば、sigmoid関数の結果をもとに、0.4~0.7は、どっちともいえないという判断をするようなルールを識別器をデプロイするアプリ側に加えるという方法もあります。
leilei

2018/03/18 08:17

皆さん お返事有難うございました! 難しい分野ですね。 これから頑張らなければならないと思います。
guest

0

テンプレートマッチングに同じく1票ですが。

画像の水増し方法を知りたいのでしょうか?
機械学習のデータセット画像枚数を増やす方法


2018/03/17追記
質問文が通貨の100円玉との事なので念のためにリンクを張っておきます。
法律の専門家ではないですが、一般論として

刑法に通貨及証券模造取締法があります。
印刷物は問題になる可能性があるので、意識して取り扱ってくださいな。

■参考情報
財務省 紙幣や硬貨の写真やイラストを印刷物に使用したのですが、どうしたら良いですか
銀行券の複製に関する法的規制、取締り法規

投稿2018/03/16 14:40

編集2018/03/16 15:30
umyu

総合スコア5846

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

leilei

2018/03/16 20:59 編集

ご心配ありがとうございます。 そもそも架空な話ですけれども、逆に犯罪防止にも利用できるかも。
guest

0

テンプレートマッチングしたら良いのではないでしょうか?

硬貨は回転が処理にくいと思います。

投稿2018/03/16 13:37

mkgrei

総合スコア8560

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

leilei

2018/03/16 21:00 編集

お返答ありがとうございます。 「テンプレートマッチング」は実はもっとも難しい方法です。 原理的に簡単そうですけれども、よっぽど適切な前処理(非常に時間かかります)をしない限り実用にならないのです。 標準画像が理想的であっても、TEST画像にはいろいろ問題あります----- 影、微小変形、ノイズ、傷、汚れ、コントラストの変化、ポーズ補正後も微小変動の存在、、、 「テンプレートマッチング」は上記現象に非常に弱いのです。 D-CNNをベースにしたautoencoder-decoder系ならrobust性があるそうですし、 なんと言っても、D-CNNの判定時間は非常に速いですね。 なので、このような方法に入門しようとしています。 気になるのは、もし正例の画像があって、負例の画像がないか無限に多様の場合、 どうやってD-CNNを訓練するの? という問題です。  アイディア宜しくお願いします。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問