機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。
Q&A
解決済
2回答
1415閲覧
総合スコア37
0グッド
0クリップ
投稿2017/06/05 14:12
0
ディープラーニングをやろうとしているのですが、学習データがどのくらい必要なのかわかりません。最低どれくらいのデータがあればいいのでしょうか?
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
質問へのコメント
回答2件
ベストアンサー
タスクに依りますが、FineTuning等の手法によって大量データで学習済のモデルを利用することができるため、 例えば画像分類であれば1ラベル100-1000枚あれば上手くいく場合もあります(あくまで参考です) http://qiita.com/daisukelab/items/f0f0c4e699e901bee27a http://aidiary.hatenablog.com/entry/20170131/1485864665
もちろん多いほうが良いのですが、データが歯抜けだったり、実は中身が同じデータばかりであれば多いとはいえず、実運用の入力データを意識できるような、質を担保したデータを集めることが機械学習をするための泥臭い前処理であり、最も重要な部分だと思います 機械学習屋がマエショリストと言われる所以もここにあります http://tjo.hatenablog.com/entry/2013/12/17/201529
投稿2017/06/18 06:22
総合スコア184
回答へのコメント
2017/06/20 01:23
デープラーニングには詳しくないので正解は識者の方に任せますが、 ↓を検索して読んでみると良いかもしれません。 「統計 サンプルサイズ 決め方」
投稿2017/06/05 14:27
総合スコア891
2017/06/07 04:47
2017/06/07 10:40
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
15分調べてもわからないことはteratailで質問しよう!
ただいまの回答率85.50%
質問をまとめることで思考を整理して素早く解決
テンプレート機能で簡単に質問をまとめる
ディープラーニングの学習データについて
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/06/20 01:23