前提・実現したいこと
ここに質問の内容を詳しく書いてください。
最近pythonを用いて機械学習を始めた者です。
現在google colabを用いての開発を行っているのですが、
googleドライブ上のCSVファイルを複数読み込んで一つのCSVファイルに結合させるには
どうすればよいでしょうか?
初歩的なことで申し訳ありません。
classification.py
import pandas as pd
import numpy as np
from sklearn import svm, metrics, cross_validation
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=1)
csvファイルを読み込む
csv = pd.read_csv("iris.csv")←複数のCSVファイルを読み込んで結合させたい
任意の列を抽出
csv_data = csv[["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]]
csv_label = csv["Name"]
学習用とテスト用に分割
train_data, test_data, train_label, test_label =
cross_validation.train_test_split(csv_data, csv_label)
データを学習し、予測
clf = svm.SVC()
clf.fit(train_data, train_label)
pre = clf.predict(test_data)
正解率を求める
ac_score = metrics.accuracy_score(test_label, pre)
print("正解率 =", ac_score)
未知のデータを予測
newdata = np.array([[5.8,2.6,4.0,1.2]])
print("newdata.shape: {}".format(newdata.shape))
knn.fit(train_data, train_label)
prediction = knn.predict(newdata)
print("Predicted target name: {}".format(prediction))
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2021/09/21 05:15