質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

2254閲覧

pythonの混合ガウス分布での等高線の描画方法について

Kosuke-Yanai

総合スコア1

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2020/08/13 01:52

pythonで混合ガウス分布の等高線の描画方法を教えて下さい

アヤメデータから作成した散布図上に
混合ガウス分布を使用した等高線を表示したいのですが、
次元数やデータ数が一致しない旨のエラーが発生しています。
対処法、アドバイスなどご教授頂けないでしょうか?

発生している問題・エラーメッセージ

ValueError Traceback (most recent call last) <ipython-input-160-ebd3abcac2b9> in <module> 14 x, y = np.meshgrid(np.linspace(-10, 10, 100), np.linspace(-10, 10, 100)) 15 X = np.array([x, y]).reshape(2, -1).transpose() ---> 16 probs = model.predict_proba(X) 17 Probs = probs.reshape(100, 100) 18 colors = ["red", "blue", "green"] C:\ProgramData\Anaconda3\lib\site-packages\sklearn\mixture\base.py in predict_proba(self, X) 393 """ 394 self._check_is_fitted() --> 395 X = _check_X(X, None, self.means_.shape[1]) 396 _, log_resp = self._estimate_log_prob_resp(X) 397 return np.exp(log_resp) C:\ProgramData\Anaconda3\lib\site-packages\sklearn\mixture\base.py in _check_X(X, n_components, n_features, ensure_min_samples) 61 raise ValueError("Expected the input data X have %d features, " 62 "but got %d features" ---> 63 % (n_features, X.shape[1])) 64 return X 65 ValueError: Expected the input data X have 4 features, but got 2 features

該当のソースコード

python

1from sklearn.mixture import GaussianMixture 2from sklearn.datasets import load_iris 3import numpy as np 4import matplotlib.pyplot as plt 5%matplotlib inline 6 7data = load_iris() 8 9#ガウス分布の数 10n_components = 3 11 12model = GaussianMixture(n_components=n_components) 13model.fit(data.data) 14 15#グリッド作成 16x, y = np.meshgrid(np.linspace(-10, 10, 100), np.linspace(-10, 10, 100)) 17X = np.array([x, y]).reshape(2, -1).transpose() 18 19probs = model.predict_proba(X) 20Probs = probs.reshape(100, 100) 21colors = ["red", "blue", "green"] 22plt.scatter(X[:, 0], X[:, 1]) 23plt.contour(x, y, Probs) 24plt.xlim(-10, 10) 25plt.ylim(-10, 10) 26plt.show()

試したこと

下記の様にreshape部分を書き換えると上記エラーは脱しますが、
代わりに別のエラー(データ数不一致?)が発生してしまいました。
変更前:X = np.array([x, y]).reshape(2, -1).transpose()
変更後:X = np.array([x, y]).reshape(4, -1).transpose()

変更後のエラーメッセージ:

ValueError Traceback (most recent call last) <ipython-input-165-d6d42af485ca> in <module> 18 19 probs = model.predict_proba(X) ---> 20 Probs = probs.reshape(100, 100) 21 colors = ["red", "blue", "green"] 22 plt.scatter(X[:, 0], X[:, 1]) ValueError: cannot reshape array of size 15000 into shape (100,100)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2020/08/13 03:45

そのグラフの縦軸、横軸、色の値はそれぞれ何になりますか(がくの長さ長さなど)? また、散布図のみでしたら描画できますか?
guest

回答2

0

ベストアンサー

そもそもなのですが、散布図を描くためには4つの特徴量のうち2つを選ぶ必要があるのではないしょうか?
同様にガウス混合分類器も4つではなく2つの特徴量で訓練する必要があるかと思います。

以下sepal length (cm)sepal width (cm)で散布図と等高線図を描く例です。

Python

1 2from sklearn.mixture import GaussianMixture 3from sklearn.datasets import load_iris 4import numpy as np 5import matplotlib.pyplot as plt 6 7data = load_iris() 8N_CLASS = len(data.target_names) # 3 9LEN_CLASS = len(data.target) // N_CLASS # 50 10 11vx,vy = 0,1 # 対象の2変数 12x_min, x_max = min(data.data[:,vx]), max(data.data[:,vx]) 13y_min, y_max = min(data.data[:,vy]), max(data.data[:,vy]) 14 15# 2変数で散布図を描画 16cs = [] 17for c in 'rgb': 18 cs += list(c*LEN_CLASS) 19plt.scatter(data.data[:,vx], data.data[:,vy], c=cs) 20plt.xlabel(data.feature_names[vx]) 21plt.ylabel(data.feature_names[vy]) 22plt.xlim(x_min, x_max) 23plt.ylim(y_min, y_max) 24 25# 散布図に合わせた2変数で訓練 26model = GaussianMixture(n_components=N_CLASS, random_state=3) 27model.fit(data.data[:,[vx,vy]]) 28 29# 存在する範囲内で点群を生成 30N = 100 31x, y = np.meshgrid(np.linspace(x_min,x_max,N), np.linspace(y_min,y_max,N)) 32X = np.array([x, y]).reshape(2, -1).T 33probs = model.predict_proba(X) 34 35# 等高線図を各クラス毎に描画 36cs = ['Reds', 'Greens', 'Blues'] # 散布図の色とは必ずしも対応しないことに注意 37assert len(cs) == N_CLASS 38for i in range(N_CLASS): 39 plt.contourf(x, y, probs[:,i].reshape(N,N), cmap=cs[i], alpha=0.2) 40 plt.xlim(x_min, x_max) 41 plt.ylim(y_min, y_max) 42plt.show()

イメージ説明

投稿2020/08/13 18:07

編集2022/04/05 12:42
can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Kosuke-Yanai

2020/08/14 01:44

詳細に返答いただきありがとうございました。 ご指摘通り、散布図にする際に変数を2つに絞る必要がありました。 散布図とは別に等高線図を作成し、それらを重ねるイメージなのですね。 非常に参考になりました。
guest

0

numpyのreshapeの引数は一つ目が行方向で二つめが列方向です。

plt.scatter(X[:, 0], X[:, 1])

この書き方から期待しているreshape後のデータの形状は列方向にxとyが並んだ状態と推測してますが合ってますか?

解決策としては以下でどうでしょうか?

From

X = np.array([x, y]).reshape(2, -1).transpose()

To

X = np.array([x, y]).reshape(-1, 2).transpose()

投稿2020/08/13 10:22

msoniku

総合スコア36

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Kosuke-Yanai

2020/08/14 01:51

返答いただきありがとうございました。 reshape後のX,yのデータの並びはご推察通り、列方向に並んでいます。 エラーの原因としては、散布図描画のために2つの変数に絞っていなかったためでした。 ご教授頂いた対処方法を試してもエラーは解消には至りませんでしたが、 データ並びを変えるというアプローチが実践でき、大変参考になりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問