観測地の座標点(経度、緯度、高度)と観測値の4つのカラムが入ったCSVファイルを用いて観測値の局所的最大値検出を行いたいため、下記のような処理手順を考えました。
① 各点に対して全観測点とのユークリッド距離を算出する。
② 各点に対して最近傍点N個を抽出する。
③ 各点の観測値と最近傍点N個の観測値を比較する。
→ 各点の観測値のほうが大きい場合は局所的最大値とする。
上記の方法で概ね検出はできているのですが、ハイパーパラメーターとなるNと観測点の数の組み合わせによって検出される個数にブレがでるため、Nの指定なしでも精度よく検出できる方法を考えています。(「精度よく」が定義できていないのも問題なのは理解しています)
統計学的な手法を用いれば上手な検出方法もあるのではないかと考えているのですが、やはり閾値となるような値を指定しなければ判定が難しいものなのでしょうか?
また、統計学的にNを指定する場合はどういった基準で値を選定しているのでしょうか?
回答2件
あなたの回答
tips
プレビュー