質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

0回答

664閲覧

ValueError: Found input variables with inconsistent numbers of samplesのエラーの対処法

n_r

総合スコア1

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2021/07/04 15:49

編集2021/07/04 16:25

前提・実現したいこと

1年分の気温などのデータから電力の予測を行うプログラムを作成していますがエラーの内容が分からなくて手詰まりになっています。
ここに質問の内容を詳しく書いてください。
(例)PHP(CakePHP)で●●なシステムを作っています。
■■な機能を実装中に以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

ValueError: Found input variables with inconsistent numbers of samples: [8770, 2619]

エラーメッセージ--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-14-c1afc537bce1> in <module>() 20 21 # 予測結果(スコア) ---> 22 Score = 'Score =' + str(model.score(x_test,y_test)) 23 print(Score) 24 2 frames /usr/local/lib/python3.7/dist-packages/sklearn/utils/validation.py in check_consistent_length(*arrays) 210 if len(uniques) > 1: 211 raise ValueError("Found input variables with inconsistent numbers of" --> 212 " samples: %r" % [int(l) for l in lengths]) 213 214 ValueError: Found input variables with inconsistent numbers of samples: [8770, 2619]

該当のソースコード

ソースコード# 検証用データ(2019年度電力需要)の読み込み filename = "/content/drive/MyDrive/Colab Notebooks/2019 .csv" df = pd.read_csv(filename,encoding="SHIFT-JIS") df = df.dropna() # 検証用データの説明変数とするデータ列の指定 x = ['Month', 'Week', 'Hour', 'Asa_Temp', 'Hako_Temp', 'Toma_Temp', 'Kushi_Temp', 'Aba_Temp'] # 検証用データの目的変数とするデータ列の指定 y = ['Power'] # それぞれの数値型を指定 x = df[x].values.astype('float') y = df[y].values.astype('int').flatten() x_test = scaler.transform(x_test) y_test = y # 予測 result = model.predict(x) # 予測結果(スコア) Score = 'Score =' + str(model.score(x_test,y_test)) print(Score) # グラフの準備 # データシートへの予測結果と年月日時刻の追加 df['PrePower'] = result df['Datetime'] = pd.to_datetime(df[['Year', 'Month', 'Day', 'Hour']]) # グラフ plt.figure(figsize=(16,4),facecolor='white') plt.title(MLname, size=16) plt.xlabel('Time') plt.ylabel('Demand (x10,000 kW)') plt.xlim(dt.datetime(2019,4,1,0), dt.datetime(2020,3,31,23)) # plt.xlim(datetime.datetime(2019,4,1,0), datetime.datetime(2019,4,2,23)) plt.grid(True) plt.plot(df['Datetime'], df['Power'], label='Act',linewidth = 0.7) plt.plot(df['Datetime'], df['PrePower'], label='Pre',linewidth = 0.7) plt.legend(loc='upper right') plt.text(dt.datetime(2019,4,2,0), 470, Score, size=14) # 作成したグラフの保存 plt.savefig("/content/drive/MyDrive/Colab Notebooks/Result.png")

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/07/05 01:47 編集

> Score = 'Score =' + str(model.score(x_test,y_test)) の「y_test」は、そこのちょっと上の > y_test = y で「y」と同じってことが分かります 一方、「x_test」は、 > x_test = scaler.transform(x_test) で突然出てきてますが、これは何でしょうか? x = df[x].values.astype('float') の「x」とは、全く別のものなのでしょうか?
jbpb0

2021/07/05 01:53 編集

> model.score(x_test,y_test) を行うのだから、「x_test」と「y_test」はペアになっていて、データ数(データのサンプル数)が同じである必要がありますけど、そこは大丈夫でしょうか? それの確認方法を書きます > # 予測結果(スコア) のすぐ上に、 print(x_test.shape) print(y_test.shape) を追加して実行したら、実行結果として数値が表示されますけど、表示された数値の内の一番左の数値が、二つの行の結果で同じじゃないとダメです おそらく、最初の行の結果表示の一番左が「2619」で、次の行が「8770」ではないですか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問