Python+OpenCV|HoG+SVMによる人物検出

前提・実現したいこと

プログラミング初心者（授業で少しかじった程度）です。
大学の授業で、渡され、言葉の意味はなんとなくわかったのですが、処理が良くわかりません。
「Python+OpenCV|HoG+SVMによる人物検出」なのですが、
どこで何がどうなっているのか、教えていただけないでしょうか？
特に、「サポートベクタマシンによる人検出」と「人を検出した座標」と「バウンディングボックス」で
どうゆう処理が行われているのか教えてください。
よろしくお願いします。

該当のソースコード

Python
1import cv2
2#処理したい画像を選択
3img_name = 'pedestrian4.jpg'
4 
5im = cv2.imread(img_name)
6# HoG特徴量の計算
7hog = cv2.HOGDescriptor()
8 
9# サポートベクタマシンによる人検出
10hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())
11hogParams = {'winStride': (8, 8), 'padding': (32, 32), 'scale': 1.2}
12 
13# 人を検出した座標
14human, r = hog.detectMultiScale(im, **hogParams)
15 
16# バウンディングボックス
17for (x, y, w, h) in human:
18    cv2.rectangle(im, (x, y),(x+w, y+h),(0,50,255), 3)
19     
20# 検出した画像を保存
21cv2.imwrite('out_default_'+img_name,im)
22

t_obara

2021/01/18 07:11

大学の授業でやるんですねぇ・・・教科書とかに参考となる情報は記載がないものなんですか？どのような教科書を利用しているのか分かりませんが。

行動規範の内容に同意します

回答1件

コードにコメントを入れると以下のようになります。

python
1import cv2
2
3# 画像を読み込む
4img_name = "pedestrian4.jpg"
5im = cv2.imread(img_name)
6
7# HOG特徴量検出器を作成
8hog = cv2.HOGDescriptor()
9
10# HOG特徴量検出器 (SVM) に学習済みの人検出の重みを設定
11hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector())
12
13# detectMultiScale() のパラメータ
14hogParams = {"winStride": (8, 8), "padding": (32, 32), "scale": 1.2}
15
16# human には検出した矩形の座標の一覧が入っている。
17# x, y: 矩形の左上の座標 w, h: 矩形の幅と高さ
18# human = [(x, y, w, h), (x, y, w, h), ...]
19human, r = hog.detectMultiScale(im, **hogParams)
20
21# 検出した矩形の座標の一覧をもとに画像に矩形を描画している
22for (x, y, w, h) in human:
23    cv2.rectangle(im, (x, y), (x + w, y + h), (0, 50, 255), 3)
24
25# 検出した画像を保存
26cv2.imwrite("out_default_" + img_name, im)