質問編集履歴
4
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -56,17 +56,21 @@
|
|
56
56
|
|
57
57
|
4. anchor boxはgrid cellの中心を自分のlocation中心とする。
|
58
58
|
|
59
|
-
5. bounding boxの中心はgrid cellの中の任意の位置に存在する可能
|
59
|
+
5. bounding boxの中心は**grid cellの中の任意の位置**に存在する可能
|
60
|
+
|
61
|
+
(★ これこそ**cell**というやつの存在意義: bounding boxの中心位置に一定の自由度を与え、具体座標値はDNNが出力してくれる)
|
60
62
|
|
61
63
|
6. anchor boxのsizeとaspectは事前固定だが、個々bounding boxのsizeとaspectはDNNでの学習で決める
|
62
64
|
|
63
|
-
|
65
|
+
(但し、bounding boxの数は人間が指定!)
|
64
66
|
|
67
|
+
7. 個々bounding boxの中に存在するobjectの名前(= annotation = “ground truth label”)は中心が同じgrid cellに存在する某anchor boxが持っているannotationにする。
|
68
|
+
|
65
|
-
8. ↑どのanchor boxのannotationにするかに関しては、中心が同じgrid cellに存在するbounding boxと諸anchor boxとのIOUの値の大きさによって決められる
|
69
|
+
8. ↑どのanchor boxのannotationにするかに関しては、中心が同じgrid cellに存在するbounding boxと諸anchor boxとのIOUの値の大きさによって決められる。
|
66
70
|
|
67
71
|
9. ↑IOUが1に一番近いanchor boxのannotationがbounding boxの中に存在するobjectのannotationとし、そのbounding boxを”本命”として選ばれる
|
68
72
|
|
69
|
-
10. ↑
|
73
|
+
10. ↑但し、囲む領域にobjectの存在確率が閾値以下であるanchor boxは対象外
|
70
74
|
|
71
75
|
|
72
76
|
|
@@ -76,13 +80,13 @@
|
|
76
80
|
|
77
81
|
|
78
82
|
|
79
|
-
1.これはあくまでも指定・特定の画像DBを対象とするK-Mean Clustering処理である。
|
83
|
+
1.これはあくまでも**指定・特定の画像DBを対象とする**K-Mean Clustering 処理である。
|
80
84
|
|
81
85
|
即ち、その特定の画像DBの諸画像の中に含まれている色々Objectの縦、幅ペアに対するClustering.
|
82
86
|
|
83
87
|
|
84
88
|
|
85
|
-
2.K-Mean Clusteringなので、結果はClustering予定数に左右されがちである。
|
89
|
+
2.K-Mean Clusteringなので、**結果はClustering予定数に左右**されがちである。
|
86
90
|
|
87
91
|
これも人間が指定して上げなければならない。。。
|
88
92
|
|
@@ -92,6 +96,6 @@
|
|
92
96
|
|
93
97
|
3.Clusteringの予定数が大きいほど、各Clusterの縦、幅分布範囲が狭くなり、学習対象とする画像DBにおいてIOUが1に近づいて行く。。。
|
94
98
|
|
95
|
-
4.**各Clusterの中心縦、幅が諸objectの代表サイズとし**、anchor boxの縦、幅
|
99
|
+
4.**各Clusterの中心縦、幅が諸objectの代表サイズとし**、anchor boxの縦、幅にする-----5ペアや8ペア程度に決める。
|
96
100
|
|
97
|
-
**↑こ
|
101
|
+
**↑この4こそK-Mean ClusteringがFOLOV2に利用される目的だ!**
|
3
心得
test
CHANGED
File without changes
|
test
CHANGED
@@ -28,4 +28,70 @@
|
|
28
28
|
|
29
29
|
|
30
30
|
|
31
|
+
======解決済みとは言えないので、**★不適切な処ご指摘お願い致します★**=========
|
32
|
+
|
33
|
+
|
34
|
+
|
35
|
+
●● 試しにYOLOV2の**キーテクニック**を解説 ●●
|
36
|
+
|
37
|
+
|
38
|
+
|
31
|
-
|
39
|
+
【根拠】
|
40
|
+
|
41
|
+
https://medium.com/@vivek.yadav/part-1-generating-anchor-boxes-for-yolo-like-network-for-vehicle-detection-using-kitti-dataset-b2fe033e5807
|
42
|
+
|
43
|
+
|
44
|
+
|
45
|
+
**【bounding boxの選出原理】**
|
46
|
+
|
47
|
+
|
48
|
+
|
49
|
+
1. anchor boxは縦と幅のsize、aspect(縦と幅の比)が人間に事前指定された幾つかの値(E.g, 5か8 etc)を持つ四角形である。
|
50
|
+
|
51
|
+
(勿論人間指定には主観性がある。大体車は幅のほうが長い、人間は縦のほうが長い----幾つか限られた実用的なobjectを想定して決める!? )
|
52
|
+
|
53
|
+
2. bounding boxは画像に存在するobjectを囲むboxの候補である。
|
54
|
+
|
55
|
+
3. anchor boxとbounding boxは違う役で、両者が全く一致となるのは稀なケース。
|
56
|
+
|
57
|
+
4. anchor boxはgrid cellの中心を自分のlocation中心とする。
|
58
|
+
|
59
|
+
5. bounding boxの中心はgrid cellの中の任意の位置に存在する可能
|
60
|
+
|
61
|
+
6. anchor boxのsizeとaspectは事前固定だが、個々bounding boxのsizeとaspectはDNNでの学習で決める
|
62
|
+
|
63
|
+
7. 個々bounding boxの中に存在するobjectの名前(= annotation = “ground truth label”)は中心が同じgrid cellに存在する某anchor boxが持っているannotationにする
|
64
|
+
|
65
|
+
8. ↑どのanchor boxのannotationにするかに関しては、中心が同じgrid cellに存在するbounding boxと諸anchor boxとのIOUの値の大きさによって決められる
|
66
|
+
|
67
|
+
9. ↑IOUが1に一番近いanchor boxのannotationがbounding boxの中に存在するobjectのannotationとし、そのbounding boxを”本命”として選ばれる
|
68
|
+
|
69
|
+
10. ↑ただし、囲む領域にobjectの存在確率が閾値以下であるanchor boxは対象外
|
70
|
+
|
71
|
+
|
72
|
+
|
73
|
+
|
74
|
+
|
75
|
+
**【K-Mean Clusteringの役割】**
|
76
|
+
|
77
|
+
|
78
|
+
|
79
|
+
1.これはあくまでも指定・特定の画像DBを対象とするK-Mean Clustering処理である。
|
80
|
+
|
81
|
+
即ち、その特定の画像DBの諸画像の中に含まれている色々Objectの縦、幅ペアに対するClustering.
|
82
|
+
|
83
|
+
|
84
|
+
|
85
|
+
2.K-Mean Clusteringなので、結果はClustering予定数に左右されがちである。
|
86
|
+
|
87
|
+
これも人間が指定して上げなければならない。。。
|
88
|
+
|
89
|
+
★ DNNと言っても人間の「経験」と「主観」が基盤。
|
90
|
+
|
91
|
+
|
92
|
+
|
93
|
+
3.Clusteringの予定数が大きいほど、各Clusterの縦、幅分布範囲が狭くなり、学習対象とする画像DBにおいてIOUが1に近づいて行く。。。
|
94
|
+
|
95
|
+
4.**各Clusterの中心縦、幅が諸objectの代表サイズとし**、anchor boxの縦、幅とする-----5ペアや8ペア程度に決める。
|
96
|
+
|
97
|
+
**↑これ4こそK-Mean ClusteringがFOLOV2に利用される目的だ!**
|
2
sdfsdfds
test
CHANGED
File without changes
|
test
CHANGED
@@ -25,3 +25,7 @@
|
|
25
25
|
|
26
26
|
|
27
27
|
どうぞ宜しくお願いします。
|
28
|
+
|
29
|
+
|
30
|
+
|
31
|
+
sdfasdf
|
1
文字訂正
test
CHANGED
File without changes
|
test
CHANGED
@@ -14,7 +14,7 @@
|
|
14
14
|
|
15
15
|
|
16
16
|
|
17
|
-
Q2: IoUという指標の数学的意味は
|
17
|
+
Q2: IoUという指標の数学的意味は分かりますけれども、使用上の意味は分かりません。
|
18
18
|
|
19
19
|
どうしてこれで、"Non-Maximum Suppression"ができるのでしょうか。
|
20
20
|
|