質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Q&A

解決済

1回答

284閲覧

画像に関するパラメータの詳細が分かりません

S.S_Japan

総合スコア14

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

0グッド

0クリップ

投稿2022/07/28 05:31

前提

こちらのpythonライブラリを用いてHRNetの手法をベースとしたランドマーク検出を行いたいです。

https://github.com/HRNet/HRNet-Facial-Landmark-Detection

実際に300Wデータセットを用いて学習・テストができることを確認しました。

実現したいこと

300Wデータセットを自前のデータセットに置き換えて学習を行いたいです。

発生している問題

300Wデータセットのアノテーションファイルの中身を自前のデータセットに合わせて置き換えようと思うのですが、
分からないパラメータがあったので質問させていただきます。
image_nameは画像ファイルの名前、original_()x, original()_y, は各ランドマークの座標であることは分かりました。
ただ、scale, center_w, center_h が画像のどの情報のことなのかが分かりませんでした。

例えば afw/397921011_2.jpg は以下のような画像なのですが、画像サイズは1280×960(pixel)でした。

イメージ説明

イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

投稿2022/07/28 05:43

can110

総合スコア38268

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

S.S_Japan

2022/07/28 08:13

ご回答ありがとうございます。 こちらのページをさっそく確認しました。 scale = max(w, h) / 200 center_w = (x1 + x2) / 2 center_h = (y1 + y2) / 2 を表しており、 ここでの w,h は顔のバウンディングボックスの幅と高さ、 x1,y1は顔のバウンディングボックスの左上の座標、 x2,y2は顔のバウンディングボックスの右下の座標、 ということだったのですね。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問