teratail header banner
teratail header banner
質問するログイン新規登録

回答編集履歴

3

一部修正

2021/02/04 22:44

投稿

toast-uz
toast-uz

スコア3266

answer CHANGED
@@ -10,4 +10,4 @@
10
10
  補足追記です。
11
11
 
12
12
  最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
13
- 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして数100万枚〜数1000万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。
13
+ 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして単純には数100万枚〜数1000万枚を用意する必要があります(データ拡張とか、やりようはありますが)。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。

2

誤字の修正

2021/02/04 22:44

投稿

toast-uz
toast-uz

スコア3266

answer CHANGED
@@ -10,4 +10,4 @@
10
10
  補足追記です。
11
11
 
12
12
  最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
13
- 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データ数100万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。
13
+ 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして数100万枚〜数1000万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。

1

補足追記

2021/02/04 22:42

投稿

toast-uz
toast-uz

スコア3266

answer CHANGED
@@ -5,4 +5,9 @@
5
5
  - 正解ラベルとしてウッチャン画像にはA、ナンチャン画像にはB、その他の画像にはCを付与する
6
6
  - 各クラスの画像をなるべく多く学習させる
7
7
 
8
- なお、学習データ・テストデータともに、各クラスでの数の大きな偏りが無いことが望ましいです。
8
+ なお、学習データ・テストデータともに、各クラスでの数の大きな偏りが無いことが望ましいです。
9
+
10
+ 補足追記です。
11
+
12
+ 最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
13
+ 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データ数100万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。