前提・実現したいこと
機械学習でワインの品質判定を実施しています。
データは以下のアドレスから取得したものになります。
https://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv
発生している問題・エラーメッセージ
以下のエラーメッセージが表示され動いてくれません
ValueError: Found input variables with inconsistent numbers of samples: [4898, 1]
該当のソースコード
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report
wine=pd.read_csv("winequality-white.csv",sep=";",encoding="utf-8")
y=["quality"]
x=wine.drop("quality", axis=1)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)
試したこと
read_ccsvでデータを表示させると正しく表示され、おかしくはないように見えるのですが。。。
回答1件
あなたの回答
tips
プレビュー