質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

14026閲覧

scatter_matrixの引数が何を表しているかわかりません

xkx

総合スコア13

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/07/05 11:19

Python

1grr = pd.scatter_matrix(iris_dataframe,c=y_train,figsize=(15,15),marker='o',hist_kwds={'bins': 20},s=60,alpha=.8,cmap=mglearn.cm3)

上記のコードのそれぞれの引数が散布図を書く上で何を表しているのかわかりません.
分かる方がいたら教えて欲しいです.
自分で調べてよく分からなかったので質問させてもらいました.

iris_dataframeはsklearn内のload_iris()によってつくられたdatasetです.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

そのコードだけ見せられても多分に推測が入った情報しか書けませんが、幸いドキュメントからある程度はわかります。

とりあえずわかる範囲で答えると、

  • c=y_train

matplotlibのscatterに渡る引数で、こうするとy_trainを0-1にスケーリングした値をcmapに通した色が点の色になります。

  • figsize=(15,15)

図のサイズ

  • marker='o'

これもscatterに渡る引数で、マーカの形を指定しています。

  • hist_kwds={'bins': 20}

ヒストグラムのbins(棒の数)を指定しています。

  • s=60

scaterに渡る引数で、マーカのサイズ。

  • alpha=.8

図上のオブジェクトの透明度です。

  • cmap=mglearn.cm3

カラーマップ。どんな色で描画するかを指定しています。matplotlibのカラーマップの概念を理解していないと意味不明だと思うので、ご自身で調べてください。

参考:
pandas.plotting.scatter_matrix — pandas 0.23.1 documentation
pandas.DataFrame.hist — pandas 0.23.1 documentation
matplotlib.pyplot.scatter — Matplotlib 2.2.2 documentation


load_iris()DataFrameを返さないので、渡す前に何らかの加工が行われていると思われます。

なので、結果はiris_dataframeの中身によって変わると思います。c=y_trainということはこのデータフレームには学習データだけ入っていないとまずい結果になりそうですが、どうなっているのだろう。

投稿2018/07/05 11:54

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xkx

2018/07/05 12:22

丁寧な回答ありがとうございました! load_iris()で作られたdatasetにtrain_teat_splitを行ってX_train,X_test,y_train,y_testの四つに分割していました.その後にiris_dataframe=pandas.DataFrame(X_train,columns=iris_dataset.feature_names) でdataframeにしているみたいです
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問