回答編集履歴
1
a
test
CHANGED
@@ -177,3 +177,33 @@
|
|
177
177
|
|
178
178
|
|
179
179
|
後者の場合、撮影する距離が固定とか限定された条件がない限り、画像からは実際のスケールはわからないので無理です。
|
180
|
+
|
181
|
+
|
182
|
+
|
183
|
+
## 追記
|
184
|
+
|
185
|
+
|
186
|
+
|
187
|
+
CNN で物体の検出、分類を行う場合、以下のアプローチがあります。
|
188
|
+
|
189
|
+
|
190
|
+
|
191
|
+
* クラス分類: 与えた画像からクラスを分類する。
|
192
|
+
|
193
|
+
* 物体検出: 与えた画像から物体の位置及びクラスを矩形で検出する。
|
194
|
+
|
195
|
+
* Semantic Segmentation: 与えた画像から物体の位置及びクラスをピクセル単位で分類する。
|
196
|
+
|
197
|
+
* Instance Segmentation: 与えた画像から物体の位置及びインスタンスをピクセル単位で分類する。(同じクラスの物体が複数写っている場合、それぞれ区別する。)
|
198
|
+
|
199
|
+
|
200
|
+
|
201
|
+
難易度としては後者ほど難しくなります。
|
202
|
+
|
203
|
+
また物体検出や Segmentation は、大量の画像に対して人手でアノテーションを行わないといけないので、データセット作成にかなり労力がかかります。
|
204
|
+
|
205
|
+
|
206
|
+
|
207
|
+
![イメージ説明](bf66e5cbfb5ea2ab97ddd5cff663ad04.jpeg)
|
208
|
+
|
209
|
+
[引用元 Semantic segmentation2](https://www.slideshare.net/takmin/semantic-segmentation2)
|