回答編集履歴

edit

2018/03/26 12:23

投稿

mkgrei

スコア8562

test CHANGED Viewed

@@ -225,3 +225,9 @@
 局在したガウシアンの場合(gamma=10000.)
 ![局在したガウシアン](36a1f12aca19dd741317073a61149f14.png)
+CVしたガウシアンの場合
+![最適化したガウシアン](2cd5ffe22ffcfa5b089ce81be2420892.png)

edit

2018/03/26 12:23

投稿

mkgrei

スコア8562

test CHANGED Viewed

@@ -222,6 +222,6 @@
-局在したガウシアン(gamma=10000.)
+局在したガウシアンの場合(gamma=10000.)
 ![局在したガウシアン](36a1f12aca19dd741317073a61149f14.png)

edit

2018/03/26 12:15

投稿

mkgrei

スコア8562

test CHANGED Viewed

@@ -201,3 +201,27 @@
     CV(get_OneHot, *load(fonehot=True))
 ```
+---
+追記
+IrisのXに2変数を使って平面上に射影したときの境界線。
+広がったガウシアンの場合(gamma=0.000001)
+![広がったガウシアン](0ad73d4bbe9e4c92c1f070ada5abba0c.png)
+局在したガウシアン(gamma=10000.)
+![局在したガウシアン](36a1f12aca19dd741317073a61149f14.png)

edit

2018/03/26 12:15

投稿

mkgrei

スコア8562

test CHANGED Viewed

@@ -7,3 +7,197 @@
 sklearnのSVCはOne-vs-Oneで実装されていませんか？
+---
+簡単なIrisに対してのコード。
+SVCをもうすでに使っているのならマルチクラスを分類できない理由は特にないように思いましたが…
+```python
+import numpy as np
+from sklearn.datasets import load_iris
+from sklearn.preprocessing import OneHotEncoder
+from sklearn.metrics import accuracy_score
+from sklearn.model_selection import StratifiedKFold
+from sklearn.model_selection import RandomizedSearchCV
+from sklearn.svm import SVC
+from sklearn.multiclass import OneVsRestClassifier, OneVsOneClassifier
+from sklearn.multioutput import MultiOutputClassifier
+def load(fonehot=False):
+    data = load_iris()
+    x = data['data']
+    y = data['target']
+    hs = y
+    if fonehot:
+        en = OneHotEncoder()
+        y = en.fit_transform(y.reshape(-1, 1)).toarray()
+    return x, y, hs
+def get_SVC():
+    clf = SVC()
+    param_grid = {'kernel': ['rbf', 'linear'],
+                  'C': np.logspace(-10, 1, 1000),
+                  'gamma': np.logspace(-10, 1, 1000)}
+    clf = RandomizedSearchCV(clf, param_grid, cv=5, n_iter=100, random_state=2018)
+    return clf
+def get_OvR():
+    clf = SVC()
+    clf = OneVsRestClassifier(clf)
+    param_grid = {'estimator__kernel': ['rbf', 'linear'],
+                  'estimator__C': np.logspace(-10, 1, 1000),
+                  'estimator__gamma': np.logspace(-10, 1, 1000)}
+    clf = RandomizedSearchCV(clf, param_grid, cv=5, n_iter=100, random_state=2018)
+    return  clf
+def get_OvO():
+    clf = SVC()
+    clf = OneVsOneClassifier(clf)
+    param_grid = {'estimator__kernel': ['rbf', 'linear'],
+                  'estimator__C': np.logspace(-10, 1, 1000),
+                  'estimator__gamma': np.logspace(-10, 1, 1000)}
+    clf = RandomizedSearchCV(clf, param_grid, cv=5, n_iter=100, random_state=2018)
+    return  clf
+def get_OneHot():
+    clf = SVC()
+    clf = MultiOutputClassifier(clf)
+    param_grid = {'estimator__kernel': ['rbf', 'linear'],
+                  'estimator__C': np.logspace(-10, 1, 1000),
+                  'estimator__gamma': np.logspace(-10, 1, 1000)}
+    clf = RandomizedSearchCV(clf, param_grid, cv=5, n_iter=100, random_state=2018)
+    return  clf
+def CV(get_clf, x, y, hs, n_splits=3):
+    kf = StratifiedKFold(n_splits=n_splits, shuffle=True, random_state=2018)
+    s_s = []
+    pss = []
+    for tr, ts in kf.split(x, hs):
+        x_ = x[tr]
+        y_ = y[tr]
+        px = x[ts]
+        py = y[ts]
+        clf = get_clf()
+        clf.fit(x_, y_)
+        s_ = accuracy_score(y_, clf.predict(x_))
+        ps = accuracy_score(py, clf.predict(px))
+        s_s.append(s_)
+        pss.append(ps)
+    print('train: {0:7.4f} {1:7.4f}'.format(np.mean(s_s), np.std(s_s)))
+    print('test:  {0:7.4f} {1:7.4f}'.format(np.mean(pss), np.std(pss)))
+if __name__ == '__main__':
+    print('SVC(Implemented with One-vs-one)')
+    CV(get_SVC, *load())
+    print('OneVsRest')
+    CV(get_OvR, *load())
+    print('OneVsOne')
+    CV(get_OvO, *load())
+    print('OneHot')
+    CV(get_OneHot, *load(fonehot=True))
+```