質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

2回答

765閲覧

観測地点と観測値から局所的最大値を検出するには?

Ryoooful

総合スコア11

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

0クリップ

投稿2021/06/03 11:58

観測地の座標点(経度、緯度、高度)と観測値の4つのカラムが入ったCSVファイルを用いて観測値の局所的最大値検出を行いたいため、下記のような処理手順を考えました。

① 各点に対して全観測点とのユークリッド距離を算出する。
② 各点に対して最近傍点N個を抽出する。
③ 各点の観測値と最近傍点N個の観測値を比較する。
→ 各点の観測値のほうが大きい場合は局所的最大値とする。

上記の方法で概ね検出はできているのですが、ハイパーパラメーターとなるNと観測点の数の組み合わせによって検出される個数にブレがでるため、Nの指定なしでも精度よく検出できる方法を考えています。(「精度よく」が定義できていないのも問題なのは理解しています)

統計学的な手法を用いれば上手な検出方法もあるのではないかと考えているのですが、やはり閾値となるような値を指定しなければ判定が難しいものなのでしょうか?
また、統計学的にNを指定する場合はどういった基準で値を選定しているのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

fana

2021/06/04 01:45

> やはり閾値となるような値を指定しなければ判定が難しいものなのでしょうか? 例えば↓のような一次元のデータ系列があったとして, 【どれを「局所的最大値」と見なしたいのか?】というのは話次第だと思うんですよね. -1 0 0 -2 55 50 1070 650 300 311 298 270 273 105 60 404 32 4 5 3 1 1 -1 0 1 0 0 ... なので,その「話次第」な部分についてはどうしても「ハイパーパラメータ」的な要素が必要になるのではないでしょうか.
Ryoooful

2021/06/05 07:31

ありがとうございます。 ご回答をいただき、改めて「そりゃそうだよなー」と思いました。 やはり「局所的」を定義しなければなりませんよね。 ご意見を伺って、少し冷静になったのもありますが、今回のデータ群の特性から観測値のMAX/MINから算出する方法もありかと思いました。もう一度、よりよい方法を探ってみたいと思います。
guest

回答2

0

ベストアンサー

Nよりも「ユークリッド距離」の側をパラメータとした方が
その決め方に一応の理由が付けられるような気がします.
(データの分布範囲の広さと「局所的」と考える広さの具合から考えることができるんじゃないかな,と)

投稿2021/06/04 01:30

fana

総合スコア11996

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

局所的最大値の定義次第ということになりますが、分析結果を他の人に説明するような要素が入るのであれば、あまり複雑な方法を使っても意味がないということになりそうです。

地図をグリッドで区切ってグリッドごとに最大値とかでは駄目ですか?

投稿2021/06/03 14:50

hayataka2049

総合スコア30935

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Ryoooful

2021/06/05 07:45

ご回答ありがとうございます。 >分析結果を他の人に説明するような要素が入るのであれば、あまり複雑な方法を使っても意味がないということになりそうです。 なるほど。 今回、こういった統計処理をするのは初めてだったので参考になります。 >地図をグリッドで区切ってグリッドごとに最大値とかでは駄目ですか? こちらが提供する情報が不足していましたが、今回のデータでは観測点の距離が場合によって変化するので、グリッドの大きさを変更する必要がでてくるのでNと同様のことになってしまいます。 >局所的最大値の定義次第 やはり、ここの定義が大事ですよね。 もう少しいい方法を考えてみたいと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問