質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.02%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

観測地点と観測値から局所的最大値を検出するには?

Ryoooful
Ryoooful

総合スコア11

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

2回答

0グッド

0クリップ

605閲覧

投稿2021/06/03 11:58

観測地の座標点(経度、緯度、高度)と観測値の4つのカラムが入ったCSVファイルを用いて観測値の局所的最大値検出を行いたいため、下記のような処理手順を考えました。

① 各点に対して全観測点とのユークリッド距離を算出する。
② 各点に対して最近傍点N個を抽出する。
③ 各点の観測値と最近傍点N個の観測値を比較する。
→ 各点の観測値のほうが大きい場合は局所的最大値とする。

上記の方法で概ね検出はできているのですが、ハイパーパラメーターとなるNと観測点の数の組み合わせによって検出される個数にブレがでるため、Nの指定なしでも精度よく検出できる方法を考えています。(「精度よく」が定義できていないのも問題なのは理解しています)

統計学的な手法を用いれば上手な検出方法もあるのではないかと考えているのですが、やはり閾値となるような値を指定しなければ判定が難しいものなのでしょうか?
また、統計学的にNを指定する場合はどういった基準で値を選定しているのでしょうか?

以下のような質問にはグッドを送りましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

グッドが多くついた質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

fana

2021/06/04 01:45

> やはり閾値となるような値を指定しなければ判定が難しいものなのでしょうか? 例えば↓のような一次元のデータ系列があったとして, 【どれを「局所的最大値」と見なしたいのか?】というのは話次第だと思うんですよね. -1 0 0 -2 55 50 1070 650 300 311 298 270 273 105 60 404 32 4 5 3 1 1 -1 0 1 0 0 ... なので,その「話次第」な部分についてはどうしても「ハイパーパラメータ」的な要素が必要になるのではないでしょうか.
Ryoooful

2021/06/05 07:31

ありがとうございます。 ご回答をいただき、改めて「そりゃそうだよなー」と思いました。 やはり「局所的」を定義しなければなりませんよね。 ご意見を伺って、少し冷静になったのもありますが、今回のデータ群の特性から観測値のMAX/MINから算出する方法もありかと思いました。もう一度、よりよい方法を探ってみたいと思います。

回答2

0

ベストアンサー

Nよりも「ユークリッド距離」の側をパラメータとした方が
その決め方に一応の理由が付けられるような気がします.
(データの分布範囲の広さと「局所的」と考える広さの具合から考えることができるんじゃないかな,と)

投稿2021/06/04 01:30

fana

総合スコア10670

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

0

局所的最大値の定義次第ということになりますが、分析結果を他の人に説明するような要素が入るのであれば、あまり複雑な方法を使っても意味がないということになりそうです。

地図をグリッドで区切ってグリッドごとに最大値とかでは駄目ですか?

投稿2021/06/03 14:50

hayataka2049

総合スコア30894

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

Ryoooful

2021/06/05 07:45

ご回答ありがとうございます。 >分析結果を他の人に説明するような要素が入るのであれば、あまり複雑な方法を使っても意味がないということになりそうです。 なるほど。 今回、こういった統計処理をするのは初めてだったので参考になります。 >地図をグリッドで区切ってグリッドごとに最大値とかでは駄目ですか? こちらが提供する情報が不足していましたが、今回のデータでは観測点の距離が場合によって変化するので、グリッドの大きさを変更する必要がでてくるのでNと同様のことになってしまいます。 >局所的最大値の定義次第 やはり、ここの定義が大事ですよね。 もう少しいい方法を考えてみたいと思います。

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.02%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

同じタグがついた質問を見る

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。