質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.60%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

2回答

732閲覧

ディープラーニングでの検証データの使いみち

tedmosby

総合スコア46

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2022/09/24 08:13

機械学習・深層学習を勉強していると、データを「訓練データ」「検証データ」「テストデータ」に分けることが大事だというのを見かけます。

それぞれ「訓練データ」は学習を行うデータ、「検証データ」はSVMのカーネル関数の定数などのハイパーパラメータを決めるためのデータ、「テストデータ」が学習後のモデルを評価するためのデータ、という役割を持ちますが、ディープラーニングの実装の学習をしていると(勉強不足かも知れませんが)、あまり検証データを使っている実装を見かけません。(訓練データとテストデータのみ)

ディープラーニングでの検証データの使い道はどのようなものがあるのでしょうか?
また、ディープラーニングにおけるニューラルネットワークでは”ハイパーパラメータ”にはどのようなものがあるのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

guest

回答2

1

検索して出てきた情報の提供のみの回答となりますが。
先に

ディープラーニングにおけるニューラルネットワークでは”ハイパーパラメータ”にはどのようなものがあるのでしょうか?

については【初心者】機械学習の〇〇データが分からない【図解】ハイパーパラメータって?

ニューラルネットワークだと、ニューロンの数や層の数、学習回数や学習係数などがハイパーパラメータに当たります。

ディープラーニングでの検証データの使い道はどのようなものがあるのでしょうか?

については同じく【初心者】機械学習の〇〇データが分からない【図解】検証データの使い方

検証データは、ハイパーパラメータの調整 をするために使います。

(略)

ハイパーパラメータは私たちが適切な値に設定しなければ、性能の悪いモデルになってしまいます。

さらに

What is the Difference Between Test and Validation Datasets?

Importantly, Russell and Norvig comment that the training dataset used to fit the model can be further split into a training set and a validation set,

(略)

that can be used to get an early estimate of the skill of the model.

意訳:検証データによって、あるハイパーパラメータを採用したモデルの性能を素早く見極めることができます。

という理解でよいかと思います。

投稿2022/09/24 13:13

can110

総合スコア38126

tedmosby👍を押しています

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

0

ベストアンサー

ディープラーニングでの検証データの使い道

MNISTでハイパーパラメータをいじってloss/accuracyグラフを見てみる
のグラフのオレンジ色の線が、検証(validation)データを使って算出されたものです

あまり検証データを使っている実装を見かけません。

ディープラーニングの学習を解説してる記事等では、上記Webページのように、学習過程のlossやaccuracyの学習データと検証データの違いを使って、「過学習」に付いて説明してることがあります

そのようにして「過学習」にならずにうまく学習できてるかの判断をすることは、一般的によく行われてると思います

 

ニューラルネットワークでは”ハイパーパラメータ”にはどのようなものが

いろいろありますが、たとえば
Optuna+KerasでCNNのハイパーパラメータを最適化
の「CNNのハイパーパラメータの探索」に書かれてるものや、
Kerasで書いたDLモデルをOptunaでハイパーパラメータ最適化(1)
の「ダーツ評価モデルの場合」に書かれてるものがそうです

投稿2022/09/24 14:44

jbpb0

総合スコア7638

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.60%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

同じタグがついた質問を見る

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。