質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • Python

    7953questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pythonにおいて生成したデータの図示の仕方が分かりません。

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 155

runatique

score 1

 前提・実現したいこと

pythonのライブラリの1つであるsklearnを用いてデータを作成し、それを図示したいです。
datasets.make_moonsを用いて2クラスのデータを生成し、それを1つの図にする。

 発生している問題・エラーメッセージ

plt.plot(y[:,0],y[:,1],'+')

IndexError: too many indices for array

 該当のソースコード

import tensorflow as tf
import matplotlib.pyplot as plt
from sklearn import datasets
#from sklearn.model_selection import train_test_split
#from sklearn.utils import shuffle

tf.set_random_seed(0)

N=300
X,y=datasets.make_moons(N,noise=0.3)

plt.plot(X[:,0],X[:,1],'.')
plt.plot(y[:,0],y[:,1],'+')
plt.show()

 試したこと

Xだけなら図示できますが、X,y両方を図示しようとするとエラーが出てしまいます。

 補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+2

やりたいことは、こんな感じでしょうか?

plt.plot(X[y==0, 0],X[y==0, 1], '.')
plt.plot(X[y==1, 0],X[y==1, 1], '+')
plt.show()

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/15 19:46

    なるほど、こういうことでしたか(理解が及ばなかった)

    キャンセル

  • 2018/05/15 19:57

    ありがとうございます!無事例通りの図が作成できました。
    プログラミング初心者なので恥ずかしながらお聞きしたいのですが、この変化([]の中身をこのように書く)は図にどのような影響を与えているのでしょうか。
    yというのがプロットに相当するもので、Xはその全体の総称のようなものですか?だからyが二つ必要で==0,1で表されているという感じでしょうか?

    キャンセル

  • 2018/05/15 20:11 編集

    magichanさんの代わりに答えてしまいますが、X[y==0, 0]はX[y==0][:,0]と書くのと結果的に等価です(パフォーマンスとかは違う可能性がありますが)。
    yは点の属するクラスを0,1で表現するものなので、y==0のものだけ取り出しています。y==0はboolの配列になり、numpy配列のスライスでboolの配列を渡すとTrueのところだけ取り出してくれます。
    Xはすべて点の座標です。yで対応するクラスのラベルが示されています。

    キャンセル

  • 2018/05/15 20:13

    X に入っているのが各点のポジションデータですので
    X[0, 0] は 1つ目のデータの x座標
    X[0, 1] は 1つ目のデータの y座標
    X[1, 0] は 2つ目のデータの x座標
    X[1, 1] は 2つ目のデータの y座標

    となります。
    次に、y に入っているのが各点のカテゴリデータ(1次元データ)なので
    y[0] は 1つ目のデータのカテゴリー(0 or 1)
    y[1] は 2つ目のデータのカテゴリー(0 or 1)

    になります。
    で、質問のコードやhayataka2049さんのコードにある
    plot(X[:,0], X[:,1])
    は1番目の引数に全てのデータのx座標、2番目の引数に全てのデータのy座標
    を渡しておりますので、全てのデータがプロットされます
    対して、私の回答の
    plot(X[y==0,0], X[y==0,1])
    は『カテゴリーデータが0であるデータ』を抽出してx座標とy座標を渡す。
    と言う意味となります。

    キャンセル

  • 2018/05/15 20:15

    おっ、hayataka2049さんが既にコメントを書いてますね。
    とりあえず
    print(X)
    print(y)
    print(y==0)
    print(X[y==0, 0])
    などの表示してみると理解が進むかと思います。

    キャンセル

  • 2018/05/16 09:30

    ありがとうございます!とても分かりやすく助かります!
    いろいろ試してみます!

    キャンセル

+2

y : array of shape [n_samples]

The integer labels (0 or 1) for class membership of each sample.
sklearn.datasets.make_moons — scikit-learn 0.19.1 documentation

なので、まあ色にでもしてみますか。あと散布図(scatter)を使った方が良いです。

import matplotlib.pyplot as plt
from sklearn import datasets

N=300
X,y=datasets.make_moons(N,noise=0.3)

plt.scatter(X[:,0],X[:,1],c=y)
plt.show()


結果です

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/05/15 19:58

    ありがとうございます!散布図も後にやろうと思っていたので参考にさせていただきます!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python

    7953questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。