pythonでK近傍法を実行する際に、テストデータをまとめて入力すると、エラーとなり苦慮しております。
下記のソースコードでk近傍法を行いました。
# -*- coding: utf-8 -*- import pandas as pd from sklearn.neighbors import KNeighborsClassifier #K最近傍法を実装します # データセットをロードする jockey = pd.read_csv("jockey_2.csv" , sep=",") # 特徴データとラベルデータを取り出す jockey_except_arrival = jockey.drop("arrival", axis=1) features = jockey_except_arrival.as_matrix() targets = jockey['arrival'].as_matrix() #モデルを作ります model = KNeighborsClassifier(n_neighbors=1) model.fit(features, targets) #作成したモデルに、weather:3 race_num:8 course:2 での条件でのarrivalを予測させます arrival, = model.predict([[3,8,2]]) print(arrival)
jockey_2.csvの内容は以下のとおりでございます。
weather race_num course arrival 2 11 2 1 2 12 2 1 4 10 1 0 4 8 1 0 4 6 2 1 4 5 1 0 4 4 1 0
右端が、目的変数の arrival その他は全て説明変数でございます。
御覧のように、特定の条件、例えば、上記のような、weather:3 race_num:8 course:2 での条件でのarrivalを
予測させることは出来るのですが、もっと、まとめて、例えば、下記のように
weather race_num course arrival 4 12 1 2 5 1 4 5 2 2 6 2 2 8 2 4 12 1 4 4 2
7つのテストデータを、上記のような、CSVファイルで arrival, = model.predict(上記のCSVファイルの内容) のように
一括で読み込ませて、結果を出力させるソースコードを探しております。
いろいろ試しましたが、うまく出来ませんでした。
先輩方の御教示、よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー