以下のコードでの最後らへんにあるpd.plotting.scatter_matrixの引数内のc=y_trainとすることでデータごとに色付けできる理由がわかりません。y_trainには(0, 1, 2)の要素が入っています。
Python
1from sklearn.datasets import load_iris 2from sklearn.model_selection import train_test_split 3import pandas as pd 4import matplotlib.pyplot as plt 5 6 7iris_dataset = load_iris() 8 9# print(iris_dataset['data'][:5]) 10# print(iris_dataset['target_names']) 11 12X_train, X_test, y_train, y_test = train_test_split( 13 iris_dataset['data'], iris_dataset['target'], random_state=0 14) 15 16 17# print(y_test.shape, len(y_test)) 18# print(y_train.shape, len(y_train)) 19 20# X_trainのデータからDataFrameを作成。 21iris_dataframe = pd.DataFrame(X_train, columns=iris_dataset['feature_names']) 22 23 24 25grr = pd.plotting.scatter_matrix(iris_dataframe, c=y_train, figsize=(15, 15), marker='o', 26 hist_kwds={'bins': 20}, s=60, alpha=0.8) 27 28plt.show()
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。