前提・実現したいこと
ワインデータを利用してscikit-learnの学習をしようとしているのですが、学習のタイミングでエラーが出てしまいます。
原因は何でしょうか?
発生している問題・エラーメッセージ
--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-16-1e4fae81f3e8> in <module>() 5 # データの前処理(必要であれば) 6 from sklearn import preprocessing ----> 7 X=preprocessing.MinMaxScaler().fit_transform(X) 8 9 # 訓練データとテストデータの作成 4 frames /usr/local/lib/python3.6/dist-packages/numpy/core/numeric.py in asarray(a, dtype, order) 536 537 """ --> 538 return array(a, dtype, copy=False, order=order) 539 540 ValueError: could not convert string to float: 'volatile acidity'
該当のソースコード
Python
1%matplotlib inline 2import numpy as np 3import pandas as pd 4import matplotlib.pyplot as plt 5from sklearn.model_selection import train_test_split 6 7# データを読み込む 8df=pd.read_csv("http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv",sep=";",header=None) 9print(df.columns) 10 11# 特徴データをXに入れる 12X = df.iloc[:,1:] 13# ラベルデータをyに入れる 14y = df.iloc[:,0:] 15 16 17# 訓練データとテストデータの作成 18X_train, X_test, y_train, y_test = train_test_split(X, y) 19 20# モデルの適用 21from sklearn.ensemble import RandomForestClassifier 22clf = RandomForestClassifier(n_estimators=100) 23clf.fit(X_train,y_train) 24 25# 正答率を求める 26print("正答率(学習) = ", clf.score(X_train,y_train)) 27print("正答率(テスト) = ", clf.score(X_test,y_test)) 28
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/10/15 03:52
2019/10/15 03:57
2019/10/15 04:00
2019/10/15 04:01
2019/10/15 04:13