回答編集履歴
3
d
answer
CHANGED
@@ -33,7 +33,7 @@
|
|
33
33
|
途中の層をフリーズする場合もしない場合も自分は fine-tuning と認識していましたが、どうなのでしょう。
|
34
34
|
言葉の定義の問題はおいといて、今回のケースでは全部の層のパラメータを調整しています。
|
35
35
|
|
36
|
-
[
|
36
|
+
[転移学習の方法](https://pystyle.info/pytorch-train-classification-problem-using-a-pretrained-model/#outline__3)
|
37
37
|
|
38
38
|
> MSCOCOのような既存のモデルの重みを初期値として使う理由は何でしょうか
|
39
39
|
|
2
d
answer
CHANGED
@@ -24,6 +24,10 @@
|
|
24
24
|
|
25
25
|
[keras-yolo3/model.py at master · qqwweee/keras-yolo3](https://github.com/qqwweee/keras-yolo3/blob/master/yolo3/model.py#L46)
|
26
26
|
|
27
|
+
論文だと「2.4. Feature Extractor」に記載があります。
|
28
|
+
|
29
|
+
[https://pjreddie.com/media/files/papers/YOLOv3.pdf](https://pjreddie.com/media/files/papers/YOLOv3.pdf)
|
30
|
+
|
27
31
|
> fine-tuningは通常CNNの下から何層かを解凍して、その解凍した層のみを再学習させるという認識でしたが、今回のようなオリジナルデータを検出したい場合はすべての層を解凍して学習させているということですか?
|
28
32
|
|
29
33
|
途中の層をフリーズする場合もしない場合も自分は fine-tuning と認識していましたが、どうなのでしょう。
|
1
d
answer
CHANGED
@@ -13,4 +13,25 @@
|
|
13
13
|
|
14
14
|
----
|
15
15
|
|
16
|
-
自作のデータセットを学習するのになぜ MSCOCO の重みを最初に変換して使うのかというと、モデルをゼロから学習するのは大変なので、既存の学習済みの重みを初期値として使う「fine-tuning」という転移学習手法を使うためです。
|
16
|
+
自作のデータセットを学習するのになぜ MSCOCO の重みを最初に変換して使うのかというと、モデルをゼロから学習するのは大変なので、既存の学習済みの重みを初期値として使う「fine-tuning」という転移学習手法を使うためです。
|
17
|
+
|
18
|
+
## 追記
|
19
|
+
|
20
|
+
> darknet53がYolov3の一部というのは、どの部分のことでしょうか
|
21
|
+
|
22
|
+
特徴抽出器として darknet53 を使っているということです。
|
23
|
+
keras-yolov3 だと以下の `darknet_body()` で作ってる部分
|
24
|
+
|
25
|
+
[keras-yolo3/model.py at master · qqwweee/keras-yolo3](https://github.com/qqwweee/keras-yolo3/blob/master/yolo3/model.py#L46)
|
26
|
+
|
27
|
+
> fine-tuningは通常CNNの下から何層かを解凍して、その解凍した層のみを再学習させるという認識でしたが、今回のようなオリジナルデータを検出したい場合はすべての層を解凍して学習させているということですか?
|
28
|
+
|
29
|
+
途中の層をフリーズする場合もしない場合も自分は fine-tuning と認識していましたが、どうなのでしょう。
|
30
|
+
言葉の定義の問題はおいといて、今回のケースでは全部の層のパラメータを調整しています。
|
31
|
+
|
32
|
+
[Pytorch - 事前学習モデルを使ってクラス分類モデルを学習する方法 - pystyle](https://pystyle.info/pytorch-train-classification-problem-using-a-pretrained-model/#outline__3)
|
33
|
+
|
34
|
+
> MSCOCOのような既存のモデルの重みを初期値として使う理由は何でしょうか
|
35
|
+
|
36
|
+
特徴抽出部分は学習する題材がなんであっても使い回せるものなので、潤沢な計算リソースと大量のデータが用意できるのであればゼロから学習してもよいですが、
|
37
|
+
そうでないなら、物体検出に限らず、学習済みモデルを使って重みを初期化するのが一般的です。
|