質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.33%

  • OpenCV

    1236questions

    OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

  • 機械学習

    765questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

OpenCV opencv_createsamplesのポジティブ画像について

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 806

SaintKnowledge

score 321

MacOS Sierra + OpenCV2.4.5 で画像の機械学習と格闘しています。まだ触り始めて1ケ月くらいです。

opencv_createsamplesコマンドで使用する「ポジティブ画像」について、以下をご教示頂ける方がいらっしゃったらありがたいです。くれくれな内容で申し訳ありません。「そもそも考え方が間違えている」という指摘でも大丈夫です。

希望としては、とあるスポーツの人間の動きを学習させたいと考えています。現在、学習すればするほど精度が落ちる、という現象がありまして、教え方が悪いのだろう、と思っています。

  1. opencv_createsamples -info、として、人と一緒に様々な背景が写り込んだ画像が適しているのでしょうか?それとも人画像部分をいくつかに分割した方がいいのでしょうか?

  2. この時、24px X 24px の縦横幅が最適なのでしょうか?それとも一番大きなサイズの画像中の、人が丸ごと入る長方形サイズがいいのでしょうか?ちなみに80px幅くらいでPC自体が悲鳴をあげてSTOPします。

  3. カラー写真のまま、ポジティブ画像としてもいいのでしょうか?それとも16色などに減色した方がいいのでしょうか?

*動きのある人物、物体を学習するにあたって、効果的なポジティブ画像、ネガティブ画像の作成方法、サイズ、コマンドの引数等があれば、ご教示頂けると。。

よろしくお願い致します。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

すみません、OpenCVベースではなく画像処理的な観点で回答させていただきますね
こういうタスクを考える時は、やりたいことを上手く学習できるようにデータを前処理してお膳立てできるかということにかかっています
今回のタスクでいうと、「とあるスポーツの人間の動きを学習させたい」ということですので、一旦分類問題としますね。
その人間の動きを、質問者様自身が分類した時に、どこを見ているかがキーになります
この前提を踏まえた上で、以下回答です

1.opencv_createsamples -info、として、人と一緒に様々な背景が写り込んだ画像が適しているのでしょうか?それとも人画像部分をいくつかに分割した方がいいのでしょうか?
「とあるスポーツ」の背景は常に似たような背景になりますか?背景が多様的な程、人の動きを学習するときに背景部分がノイズとなり、学習が難しくなります
例えば野球1つにおいても、河川敷の草野球と神宮球場のプロ野球では背景が全く変わってきます
そのため、背景が同じようになるようにタスクを分ける(野球の動き、でも草野球とプロで別の学習タスクとする、はたまた草野球1つでも場所によって背景がかなり変わるのであれば場所ごとに分ける等)か、多様性を理解できるほど大量のデータを学習させるか、仰ったように人の部分だけ切り取るのが良いでしょう

2.この時、24px X 24px の縦横幅が最適なのでしょうか?それとも一番大きなサイズの画像中の、人が丸ごと入る長方形サイズがいいのでしょうか?ちなみに80px幅くらいでPC自体が悲鳴をあげてSTOPします。
極端な話ですが、24x24を肉眼で見たときにその画像を分類できるか、です
オーバーなポーズであればできるかもしれません。あくびと大笑い1つとっても、細かい動きを分類するには大きい方が良いと思いますが、PCのスペックや学習時間とのトレードオフになるので、24x24でやってみて、精度が出なかったら少しずつ上げてみるのがいいのではないでしょうか

3.カラー写真のまま、ポジティブ画像としてもいいのでしょうか?それとも16色などに減色した方がいいのでしょうか?
例えば白黒にしても「とあるスポーツの人間の動き」は認識できますか?
カラー特有の特徴(例えばとあるポーズのときだけ頭が赤く光る等)があるのであればカラーの方がいいですが、そうでなければ減色した方が学習時間も削減できます
ただ、1で人だけ抜き出さなかった場合は、機械が人である部分を学習するのに肌色等を見ているかもしれないので、カラーの方がいい場合もあります
背景が複雑でなければ輪郭だけで人も動きも認識できそうだから白黒にしよう、とかそういう観点ですね

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/06/27 09:37

    返信が遅れて申し訳ありませんでした。
    とても参考になります。画像処理に関しては、もっと勉強することが多そうです。
    ありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.33%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • OpenCV

    1236questions

    OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

  • 機械学習

    765questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。