sklearnで学習したデータを使ってデータ予測をしたい

###sklearnで学習したデータを使ってデータ予測をしたい
sklearnで学習したデータを保存して学習したデータをもとに分類気を作りたいです。

現在、検討しているのがpickleで保存して、このソースコードとは違うものでしてほしいデータを投げたら答えを返してくれるというものです。

発生している問題

どうやって学習した分類気を保存して、それをどう使って作るかわからない。

該当のソースコード

python3
1import numpy as np
2import matplotlib.pyplot as plt
3import pickle
4
5# ファイルの読み込み
6Saxis_data = []
7training_data_file = open("training_data_2.data", "r")
8for line in training_data_file:
9    line = line.rstrip().split(",")
10    Saxis_data.append([float(line[0]), float(line[1])])
11training_data_file.close()
12
13                
14Saxis_target = []
15training_data_file = open("training_data_2.data", "r")
16for line in training_data_file:
17    line = line.rstrip().split(",")
18    Saxis_target.append(int(line[2]))
19training_data_file.close()
20
21
22X = np.array(Saxis_data)
23Y = np.array(Saxis_target)                  
24#print(X)
25#print(Y)
26
27from sklearn.svm import SVC
28model = SVC(gamma='scale')
29
30
31from sklearn.model_selection import train_test_split
32X_train, X_test, Y_train, Y_test = train_test_split(X, Y, random_state=3)
33
34model.fit(X_train,Y_train)
35
36
37from sklearn import metrics
38predicted = model.predict(X_test)
39expected = Y_test
40print(metrics.accuracy_score(expected,predicted))
41

試したこと

データの保存ができたがそこからどうやって分類気を作るかわからなかった。
（今回は回答の混乱を避けるためここに関しては無視してください。）

補足情報（FW/ツールのバージョンなど）

自分が考えているものよりいいものがあればそれでも大丈夫です。

行動規範の内容に同意します

回答1件

ベストアンサー

pickleを使うなら

python
1import pickle
2# ...
3
4with open("model.pkl", "wb") as f:
5    pickle.dump(model, f)

で保存して、

python
1import pickle
2# ...
3
4with open("model.pkl", "rb") as f:
5    model = pickle.load(f)
6
7# ...
8model.predict(target_data)

とかです。

投稿2019/02/10 17:43

hayataka2049

総合スコア30933

nonshi

2019/02/10 17:58

回答ありがとうございます。さっそく試してみたのですが2つめのコードで NameError: name 'target_data' is not defined と出てしまいました。

nonshi

2019/02/10 18:06

ー追加ー target_dataの部分は予測してほしいデータを入れると解釈し、そこに X_test = [0.0401541,0.155155] model.predict(X_test) と自分なりにやりましたら ValueError: Expected 2D array, got 1D array instead: array=[0.0401541 0.155155 ]. Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample. となりました。これは変数の形がおかしいから変形しろと言っているのでしょうか？