質問編集履歴
1
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,49 +1,31 @@
|
|
1
|
+
Pythonでyolo v3をコーディングしながら、yolo v3について学んでる者です。
|
2
|
+
|
3
|
+
yolo v3の論文を読んだのですが、2.1章のバンディングボックス(BB)の予測について、どのように予測しどのように学習しているのか教えて頂きたいです。
|
4
|
+
|
1
|
-
|
5
|
+
以下に、具体的にわからない点を挙げます。
|
2
6
|
|
3
7
|
|
4
8
|
|
5
|
-
|
9
|
+
2.1章の初めの方に、「ネットワークは、BBの中心座標(t_x,t_y)と縦横幅(t_w,t_h)を予測する。」と書いてあり、その後に、「BBpriorがp_w,p_hを持つならば、(b_x,b_y,b_w,b_h)を予測する」とあります。
|
6
10
|
|
7
|
-
|
11
|
+
ここで、tとbは何を示しているのでしょうか?
|
8
12
|
|
9
|
-
|
13
|
+
自分としては、tは事前定義されたアンカーボックスで、bはそのアンカーボックスの調整後のボックス情報かなと思っているのですが、よくわかりません。
|
10
14
|
|
11
15
|
|
12
16
|
|
17
|
+
また、bが調整後だとして、そもそもどのように調整しているのでしょうか?
|
18
|
+
|
19
|
+
正解矩形と予測の差を学習して、実際の新しいデータでの予測時にはその特徴を利用して調整するのでしょうか?
|
20
|
+
|
13
|
-
|
21
|
+
論文にあるオフセットの学習がよく理解できません。
|
14
22
|
|
15
23
|
|
16
24
|
|
17
|
-
|
25
|
+
だらだらと書いてしまい申し訳ありません。
|
18
26
|
|
19
|
-
|
27
|
+
何か一つでも教えて頂けると助かります。
|
20
|
-
|
21
|
-
```
|
22
28
|
|
23
29
|
|
24
30
|
|
25
|
-
### 該当のソースコード
|
26
|
-
|
27
|
-
|
28
|
-
|
29
|
-
|
31
|
+
宜しくお願いいたします。
|
30
|
-
|
31
|
-
ソースコード
|
32
|
-
|
33
|
-
```
|
34
|
-
|
35
|
-
|
36
|
-
|
37
|
-
### 試したこと
|
38
|
-
|
39
|
-
|
40
|
-
|
41
|
-
ここに問題に対して試したことを記載してください。
|
42
|
-
|
43
|
-
|
44
|
-
|
45
|
-
### 補足情報(FW/ツールのバージョンなど)
|
46
|
-
|
47
|
-
|
48
|
-
|
49
|
-
ここにより詳細な情報を記載してください。
|