質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

1240閲覧

ValueError: Found input variables with inconsistent numbers of samples:のエラー対処法

yusuke04

総合スコア0

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/05/26 14:51

前提・実現したいこと

cancerデータセットを用いて、データセットを訓練データとテストデータに分割し、訓練セットに対する性能とテストセットに対する性能を近傍点の数に対して評価したいです。
オライリー社の「Pythonで始める機械学習」の2章の2.3.2.2の箇所です。

発生している問題・エラーメッセージ

--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-35-2bc7850ca05e> in <module> 12 #モデルを構築 13 clf=KNeighborsClassifier(n_neighbors=n_neighbors) ---> 14 clf.fit(X_train,y_train) 15 #訓練セット精度を記録 16 training_accuracy.append(clf.score(X_train,y_train)) ~\Anaconda3new\lib\site-packages\sklearn\neighbors\base.py in fit(self, X, y) 890 """ 891 if not isinstance(X, (KDTree, BallTree)): --> 892 X, y = check_X_y(X, y, "csr", multi_output=True) 893 894 if y.ndim == 1 or y.ndim == 2 and y.shape[1] == 1: ~\Anaconda3new\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, accept_large_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, warn_on_dtype, estimator) 727 y = y.astype(np.float64) 728 --> 729 check_consistent_length(X, y) 730 731 return X, y ~\Anaconda3new\lib\site-packages\sklearn\utils\validation.py in check_consistent_length(*arrays) 203 if len(uniques) > 1: 204 raise ValueError("Found input variables with inconsistent numbers of" --> 205 " samples: %r" % [int(l) for l in lengths]) 206 207 ValueError: Found input variables with inconsistent numbers of samples: [426, 19]

該当のソースコード

from sklearn.datasets import load_breast_cancer cancer=load_breast_cancer() X_train,X_test,y_trian,y_test=train_test_split(cancer.data,cancer.target,stratify=cancer.target,random_state=66) training_accuracy=[] test_accuracy=[] #n_neighborsを1から10まで試す neighbors_settings=range(1,11) for n_neighbors in neighbors_settings: #モデルを構築 clf=KNeighborsClassifier(n_neighbors=n_neighbors) clf.fit(X_train,y_train) #訓練セット精度を記録 training_accuracy.append(clf.score(X_train,y_train)) #汎化精度を記録 test_accuracy.append(clf.score(X_test,y_test)) plt.plot(neighbors_settings,training_accuracy,label="training accuracy") plt.plot(neighbors_settings,test_accuracy,label="test accuracy") plt.ylabel("Accuracy") plt.xlabel("n_neighbors") plt.legend()

試したこと

補足情報(FW/ツールのバージョンなど)

Anaconda3 Python

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/05/26 15:24

X_train,y_trainのshapeはどうなっていますか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問