質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.69%
アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

Q&A

解決済

1回答

919閲覧

PYMC3を用いて区画の差をモデリングしたい

pepasuke623

総合スコア55

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。

0グッド

0クリップ

投稿2021/07/14 14:30

編集2021/07/15 00:16

お世話になります。PYMC3を用いたモデリングについてお伺いしたいと思っています。

前提・実現したいこと

<問題設定>
イメージ説明
たとえば上の図のように、ある細長い畑があるとします。細長い畑は100個の区画に分けられているとします。この100個の区画と各区画から収穫される作物の個数の関係をモデリングしたいと思います。
ここで前提として、区画同士は隣り合う区画のみに影響されるとします。例えば3番目の区画は2番目と4番目の区画に飲み影響されるとします。
こうしたときに次のようなデータが得られるとします。(描くのが大変だったのでデータを100個描いていませんが、お許しください・・・)
イメージ説明
このような前提の元で統計モデリングのテクニックを用いて区画と収穫数の関係をモデリングしたいと思っています。
<実現したいモデルについて>
rを区画ごとの差、σ_rを設計パラメータとしたとき、このような事前分布を考えます。

イメージ説明
このモデルではr[i]-r[i-1] と r[i-1]-r[i-2]の差を取ります。データの上下に追従しすぎないように、このようなものを入れようと思っています。これをPYMC3上でどの様に表現したら良いかわからない、というのが質問です。

ちなみに確率モデルは、
イメージ説明
と設定します。

試したことと発生している問題・エラーメッセージ

r[i]-r[i-1] と r[i-1]-r[i-2]を組み込むために、以前作ったモデルに手を加えて作り直そうとしました。(かつては下記のリンクを参照にしましたが、今は見れないようです・・・)
https://docs.pymc.io/notebooks/PyMC3_tips_and_heuristic.html

パラメータの設定などは隠させていただいて、下記のように書いてみました。(必要があれば略している部分も開示します)

python

1class C_model(distribution.Continuous): 2 3 def __init__(self, w, a, tau, *args, **kwargs): 4 super(CAR2, self).__init__(*args, **kwargs) 5  (中略:パラメータの設定) 6 7 def logp(self, x): 8 9 (中略:パラメータの設定) 10 return tt.sum(continuous.Normal.dist(mu=mu_w, tau=tau).logp(x)) 11 12 13with pm.Model() as spc_model: 14 15 (中略:パラメータの設定) 16 17 r =C_model('r', w=weight, a=neig, tau=tau, shape=len(data)) #★1 多分この部分をうまく書けば大丈夫だと思う 18  19(以下略:確率モデルなどを設定している)

おそらく上記★1の部分を書けば上手くいく気がしますが、どうしたら良いのかわからない状況です。

途方に暮れてしまったので、オーソドックスにこういうモデルを作成しました。

python

1N = len(data_df) 2with pm.Model() as C2_model: 3 4  (中略:パラメータの設定) 5 6 for n in range(2, N): 7 r[n] = pm.Normal(name='r'+str(n), mu=2*r[n-1]-r[n-2], tau=1/s) # このあたりでエラーになる 8(以下略:確率モデルなどを設定している)

この様に書くと計算に時間がかかる上に、下記のようなエラーが出ます。

TypeError: During handling of the above exception, another exception occurred:

このような感じで、どの様に書いたら良いのかわからず途方にくれています。
r[i]-r[i-1] と r[i-1]-r[i-2]を組み込むためのPYMC3の文法をご教授いただければと思います。

補足情報(FW/ツールのバージョンなど)

PYMC3のバージョンは3.11.2

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

guest

回答1

0

ベストアンサー

私にとって理解が難しそうな課題なのですが、
わからないなりに調べてみました。
https://blog.serverworks.co.jp/2020/09/23/115853

ゼロ除算の処理中・・・

開示頂いたコードのtau=1/sの部分、s が0になるパターンがあるのではないでしょうか

投稿2021/07/22 15:04

odataiki

総合スコア916

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

また依頼した内容が修正された場合は、修正依頼を取り消すようにしましょう。

回答へのコメント

pepasuke623

2021/07/24 12:04

ご回答ありがとうございます!! 結局モデルを変えたので検証はしていませんが、言われてみるとそんな気がしますね・・・
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.69%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

同じタグがついた質問を見る

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

統計

統計は、集団現象を数量で把握することです。また、調査で得られた性質や傾向を数量的に表したデータのことをいいます。