1.VOC2007とVOC2012で扱われているクラス数は変わらない
正:共に20クラス
2.COCOではBB位置の精度を重視した指標も用いられている
正誤は微妙ですが、COCOはたぶんCOCOデータセットのことですので、「COCOと指標云々とをつなげて考えるのは違うのではないか?」という違和感があります。よほど変なことをしていない限り、表を素直に読むと「VOCのデータだけじゃ手薄に見えたからCOCOのデータもぶっこんだらスコアが上がったよ」と見るのが自然です。
ですので、ほかの選択肢が正であればこれは誤の候補です。
3.入力の解像度は精度に影響すると考えられる
正:表のいずれもSSD300よりSSD512のほうがスコアが高い
4.SSDは小さな物体の検出を苦手とすることが予想される
正:論文にまんま書いてあります。
Figure 4 shows that SSD is very sensitive to the bounding box size. In other words, it has much worse performance on smaller objects than bigger objects. This is not surprising because those small objects may not even have any information at the very top layers.
あまり物体検出の論文などに慣れておらず
しっかりした人に怒られるかもしれませんが、私は要旨を読むより先に真っ先に図や絵、グラフ、表だけ見ます。その後にPDFをキーワード検索しながら必要なところだけ見ます。
パワーポイントで説明を受けるのに「誰も文字なんか読みたくない」、「説明を"聞かせる人"に"説明を読ませる"のは三流」、というのと同じ原理(=受け手のワガママ)です。
その後に要旨を見て、必要ならもう少し探ります。これでちょっとは時間が節約できると思います。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2022/01/10 01:40
2023/07/06 05:48
退会済みユーザー
2023/07/06 11:06 編集
2023/07/17 23:35