編集履歴

回答編集履歴

2019/10/21 06:08

投稿

スコア21962

answer CHANGED Viewed

@@ -11,25 +11,54 @@
 scikit-learn を使用する場合、StandardScaler の transform をテストデータに対しても適用すればよいです。
 pickle で保存する際は SVM オブジェクトの他、StandardScaler オブジェクトも保存します。
+## 学習時
 ```python
+import pickle
+import numpy as np
 from sklearn import svm
 from sklearn.datasets import make_blobs
 from sklearn.model_selection import train_test_split
 from sklearn.preprocessing import StandardScaler
 # データセットを作成する。
-X, y = make_blobs(n_samples=100, centers=2, random_state=0)
+X, y = make_blobs(n_samples=1000, centers=2, random_state=0)
-X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.15)
+# ホールドアウト分割する。
+X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.15, stratify=y, random_state=0)
+# テストデータは保存しておく。
+np.savez("test.npz", X=X_test, y=y_test)
-# 標準化する。
+# 学習データを標準化する。
 sc = StandardScaler()
 X_train_std = sc.fit_transform(X_train)
 # 学習する。
-clf = svm.LinearSVC(C=1)
+clf = svm.LinearSVC(C=1, random_state=0)
 clf.fit(X_train_std, y_train)
-# 推論する。
+# 保存する。
+pickle.dump(clf, open("svm.pickle", "wb"))
+pickle.dump(sc, open("scaler.pickle", "wb"))
+```
+## 推論時
+```python
+import pickle
+import numpy as np
+# 読み込む。
+clf = pickle.load(open("svm.pickle", "rb"))
+sc = pickle.load(open("scaler.pickle", "rb"))
+test_data = np.load("test.npz")
+# テストデータを標準化する。
-X_test_std = sc.transform(X_test)
+X_test_std = sc.transform(test_data["X"])
+# 予測する。
 y_pred = clf.predict(X_test_std)
 ```