質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.81%

  • Python

    5987questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Python 3.x

    4503questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • OpenCV

    871questions

    OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

AKAZEの『modified-local difference binary』の具体算法は?

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 134

oookabe

score 69

"modified-local difference binary"の具体算法を見たいですけれども、
いくら検索しても、
"diffusion"や『異方拡散』という言葉をどのWEBぺーじも同じ表現していて(その概念自体新味がないにも拘らず)、
肝心の"modified-local difference binary"に対する説明がないか、
一言二語程度しか出なかったのです。(みなOpenCVまかせ状態  笑)

これはどういう事でしょうか。理解できません。
『秘密』ではないでしょう?

"modified-local difference binary"に関する詳しい情報をご提供頂ければ幸いです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

+4

詳しい情報ではなく、調べ方についての回答となります。


AKAZEの元論文はこちらです。
Fast Explicit Diffusion for Accelerated Features in Nonlinear Scale Spaces

To preserve low computational demand and storage requirement, we also introduce a highly efficient Modified-Local Difference Binary (M - LDB) descriptor. While the original LDB descriptor presented in [20] is neither rotation nor scale invariant as BRIEF is, we build a robust binary descriptor that is rotation and scale invariant and exploits gradient information from the nonlinear scale space, increasing distinctiveness.

M-LDBは、LDBを回転不変およびスケール不変にしたものだそうです。


さて、元のLDBを提唱している論文はこちらです。
LDB: An Ultra-Fast Feature for Scalable Augmented Reality on Mobile Devices

3章『LDB: LOCAL DIFFERENCE BINARY』に詳細な説明があります。


これを読んでわからないところは引用元をさらにたどるか、実装を覗くしかないように思います。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/25 15:16

    <<Fast Explicit Diffusion for Accelerated Features in Nonlinear Scale Spaces >>をよく読んでから、作者が宣伝されている【Modified-Local Difference Binary (M - LDB) descriptor】を調べたかったのです。上記論文の中に具体算法を紹介されなかったために。
    LDBやその欠点を知っているこそ、改善の具体方法を知りたいのですね。
    ところが  ひーみーつ?

    キャンセル

  • 2018/04/25 16:34

    既に読了されているならば私はお力になれません。

    キャンセル

  • 2018/04/26 09:28

    LouiS0616さん
    本当にありがとうございました。

    キャンセル

checkベストアンサー

+3

Instead of using the average of all pixels inside each subdivision of the grid, we subsample the grids in steps that are a function of the scale σ of the feature. This approximation of the average performs well in our experiments. The scale dependent sampling in turn makes the descriptor robust to changes in scale. This process is depicted in Fig. 1(b). MLDB uses the derivatives computed in the feature detection step, reducing the number of operations required to construct the descriptor.

https://github.com/opencv/opencv/blob/7dc88f26f24fa3fd564a282b2438c3ac0263cd2f/modules/features2d/src/kaze/AKAZEFeatures.cpp#L1991

OpenCVに実装されているのなら秘密も何も、ソースコードが全部公開されています。

別にMLDBを使わないとAKAZEとはいえないほど本質的なものではないので、あまり困ることはないようにも思いますが、特別な懸念があるのであれば質問に追記していただければと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/26 09:37 編集

    mkgreiさん いろいろ本当にありがとうございます。 自分は長い間SIFTと付き合ってきたため、最近AKAZEの性能がSIFTより優れると聞いて、AKAZEに注目していますが、detectorはHessianで、AKAZEより遙か以前流行していましたし、所謂『異方性拡散』(Anisotropic diffusion equation)はもっと歴史長いと思います。 なので、いったいAKAZEの作者が何をなさって、性能やマッチング精度を改善したか、興味がありました。 まあ、そういう特徴点マッチングのやり方は非常にデリケートで、アプリケーションが貧弱だ[注]と思いますが、作者のアイディアには興味があります。 ===== [注] 特徴点の検出も descriptorもデリケートで、マッチングミスが通常多発するはずです。 位置決めのために多量の特徴点を用いてRANSACで淘汰して行って、本物を保留しなければなりません。 そして位置決めのためにも、物を認識するためにも、多量の有効ペアデータが必要なので、さらに特徴点の数を要求します。 ところが、現実の対象物にはそんなに多量の安定したcorner点があるわけありませんね。 (この類の方法をデモする画像の共通性として、幾何的な柄が強い&多い対象物が使われています。) やはり、物の認識には"方法論"としてDNNのほうはベストと思います。 そっちのほうまた宜しくお願い致します。 (お手数をお掛けしました)

    キャンセル

0

このレベルの話になると、学術論文をあたるしか道はないように思います。
そして学術論文はたいがい有料であるため、ネットには情報が無いのだと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/04/25 11:48

    "diffusion"『異方拡散』などの概念や算法のほうはよっぽど「学術的」ですね。
    でも散々に述べられています。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.81%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python

    5987questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Python 3.x

    4503questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • OpenCV

    871questions

    OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。