回答編集履歴

3

一部修正

2021/02/04 22:44

投稿

toast-uz
toast-uz

スコア3266

test CHANGED
@@ -22,4 +22,4 @@
22
22
 
23
23
  最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
24
24
 
25
- 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして数100万枚〜数1000万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。
25
+ 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして単純には数100万枚〜数1000万枚を用意する必要があります(データ拡張とか、やりようはありますが)。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。

2

誤字の修正

2021/02/04 22:44

投稿

toast-uz
toast-uz

スコア3266

test CHANGED
@@ -22,4 +22,4 @@
22
22
 
23
23
  最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
24
24
 
25
- 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データ数100万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。
25
+ 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データとして数100万枚〜数1000万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。

1

補足追記

2021/02/04 22:42

投稿

toast-uz
toast-uz

スコア3266

test CHANGED
@@ -13,3 +13,13 @@
13
13
 
14
14
 
15
15
  なお、学習データ・テストデータともに、各クラスでの数の大きな偏りが無いことが望ましいです。
16
+
17
+
18
+
19
+ 補足追記です。
20
+
21
+
22
+
23
+ 最終的にどのような問題を推論したいのか、にあわせた学習データの準備・モデル構築が必要です。
24
+
25
+ 極端には、100万枚のあらゆる画像から、ウッチャン1枚・ナンチャン1枚・その他99万9998枚を識別したい、という問題設定が考えられます。その場合、それにあわせた学習データ数100万枚を用意する必要があります。また評価関数にも注意する必要があります。なぜなら、単純にcross entropyやmean squared errorを評価関数にしてしまうと、「必ずその他を予測する」という「自明な」モデルが非常に高い評価になり、学習されてしまうからです。