質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.34%

Deep learning用に画像と数字が紐づいたデータセットの作り方が分かりません汗

受付中

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,558

score 4

前提・実現したいこと

題の通りDL用にデータセットを作成しようとしています.
具体的には猫の写った画像とその猫の位置情報 (x, y, z) の紐づいたデータセットが欲しいのですが,そのやり方が分かりません汗

画像はimg_*pngといった形で,位置情報についてはcsvファイルで*行目に位置情報を持っています.

初心者の質問で申し訳ないですが,よろしくお願いします!!

試したこと

いろいろとググってみたのですが,出てくるのが分類の話ばかりで,分類でやるようなデータの階層化は難しいのかなと思っています(下のような感じです)

setA

  • img001
  • img004

setB

  • img002
  • img003

補足情報(FW/ツールのバージョンなど)

  • win10
  • python 3.7

追記

私がやろうとしていることは,画像から物体の位置を学習をするネットワークの構築です.画像をいれたらネットワークが位置を推定して,その正解データであるcsvファイルの値との誤差を小さくしていく方向に学習が進めばいいなと考えているのですが,,,
例えば,img_05を入れたらネットワークが(2.5, 3.2, 4.0)と推定して,csvの5行目(3.0, 5.2, 3.4)との誤差を逆伝播するといったようなものです.

とてもフワッとした質問ですみません汗

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

0

ちょっと何がしたいかがわからないのですが、

  • 機械学習(深層学習)のモデルを作成する
  • 猫の写真と写っている位置の教師データは用意してある
  • 画像データ(png)と位置情報(csv)の紐づけの方法が知りたい

ということでしょうか?

漠然とした質問なのでどうすればいいかは回答できませんが、以下の情な情報を参考にして、
実際のCodeを書いて詰まったところを質問された方が良いです。

Qiita:機械学習のデータの集め方

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

学習データの作り方は、プログラム次第です。
まずは、何(分類、物体検出、セグメンテーション、など)をするかを決め、そのためにどんなデータが必要かを決めます。することのために使う方法を決め(あるいは自作する)、それにあったデータを作ります。

大抵は、ILSVRC や Common object in Context など、有名どころのデータセットの形式に合わせて作ります。

追記
あなたが検索に使用したキーワードを教えてください。「物体検出」で検索で検索すると、どうですか?

追記2

例えば,img_05を入れたらネットワークが(2.5, 3.2, 4.0)と推定して,csvの5行目(3.0, 5.2, 3.4)との誤差を逆伝播するといったようなものです.

たいていのデータセットは、CSVではありません。XMLです。
が、読み込み側の作り方次第です。
頑張ってください。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.34%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る