トップ機械学習に関する質問オライリー社「pythonではじめる機械学習」94～95ページ、3次元空間で線形SVMで見つかった決定境界をもとの２つの特徴量として表示するコードで理解できない部分があります。

編集履歴

回答編集履歴

修正

2020/05/23 16:32

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -43,7 +43,7 @@
 ![イメージ説明](036baed9ee38ee684f918844f06a15b0.jpeg)
-このままでは線形分離できないので、Φ: (x, y) → (x, y, y^2) という関数で3次元空間に射影します。3次元空間上では線形分離できるようになるので、線形 SVM で学習できます。
+このままでは線形分離できないので、Φ: (x, y) → (x, y, y^2) という関数で3次元空間に射影します。3次元空間上に射影したことで線形分離可能になったので、線形 SVM で学習できます。
 ```python
 X_new = np.hstack([X, X[:, 1:] ** 2])

修正

2020/05/23 16:32

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -43,7 +43,7 @@
 ![イメージ説明](036baed9ee38ee684f918844f06a15b0.jpeg)
-このままでは線形分離できないので、Φ: (x1, x2) → (x1, x2, x2^2) という関数で3次元空間に射影します。3次元空間上では線形分離できるようになるので、線形 SVM で学習できます。
+このままでは線形分離できないので、Φ: (x, y) → (x, y, y^2) という関数で3次元空間に射影します。3次元空間上では線形分離できるようになるので、線形 SVM で学習できます。
 ```python
 X_new = np.hstack([X, X[:, 1:] ** 2])

修正

2020/05/23 16:29

投稿

tiitoi

スコア21960

answer CHANGED Viewed

File without changes

修正

2020/05/23 16:27

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -43,7 +43,7 @@
 ![イメージ説明](036baed9ee38ee684f918844f06a15b0.jpeg)
-このままでは線形分離できないので、Φ: (x1, x2) → (x1, x2, x2^2) という関数で3次元空間に射影します。
+このままでは線形分離できないので、Φ: (x1, x2) → (x1, x2, x2^2) という関数で3次元空間に射影します。3次元空間上では線形分離できるようになるので、線形 SVM で学習できます。
 ```python
 X_new = np.hstack([X, X[:, 1:] ** 2])

修正

2020/05/23 16:27

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -105,7 +105,7 @@
 ![イメージ説明](526a7253e975e19285e63902f7bc8f48.jpeg)
-decision_function(x, y, y^2) = 0 となる {(x, y)|x, y∈ℝ} が射影前の2次元において、決定境界となります。
+{(x, y)|decision_function(x, y, y^2) = 0, x, y∈ℝ} が元の2次元空間において、決定境界となります。
 なので、decision_function(x, y, y^2) = 0 である等高線を contourf() で描画します。
 ```python

修正

2020/05/23 16:26

投稿

tiitoi

スコア21960

answer CHANGED Viewed

File without changes

修正

2020/05/23 16:24

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -33,19 +33,38 @@
 X, y = make_blobs(centers=4, random_state=8)
 y = y % 2
-# データを描画する。
 fig, ax = plt.subplots()
 class_colors = ListedColormap(["g", "k"])
 ax.scatter(X[:, 0], X[:, 1], c=y, cmap=class_colors)
+ax.set_xlabel("Feature 0")
+ax.set_ylabel("Feature 1")
 plt.show()
 ```
-![イメージ説明](4ba616b7f87151122b6dfbcbbfc85e08.jpeg)
+![イメージ説明](036baed9ee38ee684f918844f06a15b0.jpeg)
 このままでは線形分離できないので、Φ: (x1, x2) → (x1, x2, x2^2) という関数で3次元空間に射影します。
+```python
-![イメージ説明](13ecab51534b9fcaeb76fa57ab549d4c.jpeg)
+X_new = np.hstack([X, X[:, 1:] ** 2])
+fig = plt.figure(figsize=(7, 7))
+ax = fig.add_subplot(111, projection="3d")
+ax.scatter(X_new[:, 0], X_new[:, 1], X_new[:, 2], c=y, cmap=class_colors)
+ax.view_init(30, 30)
+ax.set_xlabel("Feature 0")
+ax.set_ylabel("Feature 1")
+plt.show()
+```
+![イメージ説明](3ec79079b60dfa0ce697e2f8735932b2.jpeg)
+fit() で学習します。
+```python
+svc = LinearSVC().fit(X_new, y)
+```
 射影した空間 {(x, y, y^2)|x, y∈ℝ} 上の各点と分類超平面との距離を [decision_function()](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC.decision_function) で計算します。
 ```python
@@ -71,20 +90,20 @@
 # 可視化する。
 fig = plt.figure(figsize=(9, 7))
 ax = fig.add_subplot(111, projection="3d")
-# データを可視化する。
+# 学習データの点を可視化する。
 ax.scatter(X_new[:, 0], X_new[:, 1], X_new[:, 2], c=y, cmap=class_colors)
 # 射影した空間上の各点と分類超平面との距離を可視化する。
 sc = ax.scatter(XX, YY, ZZ, c=dist, cmap="bwr", vmin=-15, vmax=15)
 # 分類超平面を可視化する。
 ax.plot_surface(XX, YY, plane, alpha=0.5)
 ax.view_init(30, 30)
-ax.set_xlabel("x")
+ax.set_xlabel("Feature 0")
-ax.set_ylabel("y")
+ax.set_ylabel("Feature 1")
 fig.colorbar(sc)
 plt.show()
 ```
-![イメージ説明](6f9fd69905ad5c7069e81b6187125654.jpeg)
+![イメージ説明](526a7253e975e19285e63902f7bc8f48.jpeg)
 decision_function(x, y, y^2) = 0 となる {(x, y)|x, y∈ℝ} が射影前の2次元において、決定境界となります。
 なので、decision_function(x, y, y^2) = 0 である等高線を contourf() で描画します。

修正

2020/05/23 16:24

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -2,12 +2,10 @@
 `np.c_[XX.ravel(),YY.ravel(),ZZ.ravel()]` ですが、
-1. XX, YY, ZZ はそれぞれ (50, 50) の2次元配列で、`ndarray.ravel()` で1次元配列につぶしているので、それぞれ (2500,) の1次元配列になる。
+1. `XX, YY, ZZ` はそれぞれ (50, 50) の2次元配列であり、`ndarray.ravel()` でそれぞれ (2500,) の1次元配列に変更しています。
-1. `numpy.c_[XX.ravel(),YY.ravel(),ZZ.ravel()]` で結合しているので、(2500, 3) の2次元配列になる。
+1. `numpy.c_[XX.ravel(),YY.ravel(),ZZ.ravel()]` で3つの1次元配列を横方向に結合しているので、(2500, 3) の2次元配列になります。
+この (2500, 3) の2次元配列を `decision_function()` に渡しています。
-これを `decision_function()` に渡しています。
-`decision_function()` は (N, 特徴量の次元数) の2次元配列を渡す必要があるため、このようにしています。
 > また、decision_functionは何をしているのでしょうか。fitと同じように決定境界を学習しているのでしょうか。
 学習自体は fit() で完了しています。
@@ -17,72 +15,92 @@
 > 以下15行目のコードでXX,YYの右にdec.reshape(XX.shape)が入るのはなぜでしょうか。これは(2500,)のdecを(50,50)にしているようですが、なぜXX,YY,ZZではないのでしょうか。
-dec.reshape(XX.shape) としているのは、contourf() の仕様上、dec の形状 (2500,) を XX, YY に合わせて (50, 50) にしなければいけないためです。
+`dec.reshape(XX.shape)` としているのは、contourf() の仕様上、`dec` の形状 (2500,) を XX, YY に合わせて (50, 50) にしなければいけないためです。
 ## コードの流れ解説
-特徴空間 S = {(x, y, y**2)|x∈ℝ, y∈ℝ} 上のデータについて、今回考えています。特徴空間 S 上から適当な個数のサンプルを以下で生成しています。
+[線形分離](https://ja.wikipedia.org/wiki/%E7%B7%9A%E5%BD%A2%E5%88%86%E9%9B%A2%E5%8F%AF%E8%83%BD)できない2次元のデータが与えられたとします。
 ```python
 import matplotlib.pyplot as plt
-import mglearn
 import numpy as np
+from matplotlib.colors import ListedColormap
+from mpl_toolkits.mplot3d import Axes3D
 from sklearn.datasets import make_blobs
 from sklearn.svm import LinearSVC
-# (N, 3) のデータと (N,) のラベルを作成
+# 2次元のデータを作成する。
 X, y = make_blobs(centers=4, random_state=8)
 y = y % 2
-X_new = np.hstack([X, X[:, 1:] ** 2])
-# 学習
+# データを描画する。
+fig, ax = plt.subplots()
-linear_svm_3d = LinearSVC().fit(X_new, y)
+class_colors = ListedColormap(["g", "k"])
+ax.scatter(X[:, 0], X[:, 1], c=y, cmap=class_colors)
+plt.show()
 ```
-![イメージ説明](360d395eb04a70afec407c4e1556821d.jpeg)
+![イメージ説明](4ba616b7f87151122b6dfbcbbfc85e08.jpeg)
-青の曲面が特徴空間、黄色、黒の点が生成されたサンプル
+このままでは線形分離できないので、Φ: (x1, x2) → (x1, x2, x2^2) という関数で3次元空間に射影します。
-SVM の学習は、データ `X_new` とラベル `y` を渡して、以下で行っています。
+![イメージ説明](13ecab51534b9fcaeb76fa57ab549d4c.jpeg)
+射影した空間 {(x, y, y^2)|x, y∈ℝ} 上の各点と分類超平面との距離を [decision_function()](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn.svm.SVC.decision_function) で計算します。
 ```python
-# 学習
+# 射影した空間上の点を作成する。
+xs = np.linspace(X_new[:, 0].min() - 2, X_new[:, 0].max() + 2, 50)
+ys = np.linspace(X_new[:, 1].min() - 2, X_new[:, 1].max() + 2, 50)
-linear_svm_3d = LinearSVC().fit(X_new, y)
+XX, YY = np.meshgrid(xs, ys)
-```
+ZZ = YY ** 2
-特徴空間 S 上に点を沢山作成して、各点の分離超平面からの距離を計算します。
+# 作成した点と分類超平面との距離を計算する。
+dist = svc.decision_function(np.c_[XX.ravel(), YY.ravel(), ZZ.ravel()])
+# SVM の超平面を計算する。
+def hyper_plane(svc, XX, YY):
+    a1, a2, a3 = svc.coef_[0]
+    b = svc.intercept_[0]
+    return (-b - a1 * XX - a2 * YY) / a3
+plane = hyper_plane(svc, XX, YY)
-```python
+# 可視化する。
+fig = plt.figure(figsize=(9, 7))
+ax = fig.add_subplot(111, projection="3d")
+# データを可視化する。
-xx = np.linspace(X_new[:, 0].min() - 2, X_new[:, 0].max() + 2, 50)
+ax.scatter(X_new[:, 0], X_new[:, 1], X_new[:, 2], c=y, cmap=class_colors)
+# 射影した空間上の各点と分類超平面との距離を可視化する。
-yy = np.linspace(X_new[:, 1].min() - 2, X_new[:, 1].max() + 2, 50)
+sc = ax.scatter(XX, YY, ZZ, c=dist, cmap="bwr", vmin=-15, vmax=15)
+# 分類超平面を可視化する。
+ax.plot_surface(XX, YY, plane, alpha=0.5)
-XX, YY = np.meshgrid(xx, yy)
+ax.view_init(30, 30)
+ax.set_xlabel("x")
+ax.set_ylabel("y")
+fig.colorbar(sc)
-ZZ = YY ** 2
+plt.show()
-dec = linear_svm_3d.decision_function(np.c_[XX.ravel(), YY.ravel(), ZZ.ravel()])
 ```
-![イメージ説明](f3d3d3b5222c36db5aaebdabc0a12709.jpeg)
+![イメージ説明](6f9fd69905ad5c7069e81b6187125654.jpeg)
-色は分類超平面からの距離を表す
-この図の等高線を描画しているのが以下です。
-等高線を引く位置は `dec.min(), 0, dec.max()` の3つにしており、dec==0 の等高線が分離超平面からの距離が0ということなので、つまり、これが分離超平面になります。
+decision_function(x, y, y^2) = 0 となる {(x, y)|x, y∈ℝ} が射影前の2次元において、決定境界となります。
+なので、decision_function(x, y, y^2) = 0 である等高線を contourf() で描画します。
-```
+```python
+fig, ax = plt.subplots()
+class_colors = ListedColormap(["g", "k"])
+# 決定境界を可視化する。
-plt.contourf(
+ax.contourf(
-    XX,
-    YY,
-    dec.reshape(XX.shape),
-    levels=[dec.min(), 0, dec.max()],
+    XX, YY, dist.reshape(XX.shape), levels=[dist.min(), 0, dist.max()], cmap="Set2"
-    cmap=mglearn.cm2,
-    alpha=0.5,
 )
+# データを可視化する。
-mglearn.discrete_scatter(X[:, 0], X[:, 1], y)
+ax.scatter(X[:, 0], X[:, 1], c=y, cmap=class_colors)
 plt.xlabel("Feature 0")
 plt.ylabel("Feature 1")
+plt.show()
 ```
-![イメージ説明](53e7836ba3d1d009aa428e22d7a586b5.jpeg)
+![イメージ説明](ee23606b23b8d2debce89dce1f583732.jpeg)
-## コメント
-書籍は持っていないのですが、特徴量の次元が3次元になっているので、決定境界の可視化を学ぶという目的には難解なサンプルだと思います。
-2次元の特徴量を使って確認したほうが理解しやすいと思います。

修正

2020/05/23 16:17

投稿

tiitoi

スコア21960

answer CHANGED Viewed

File without changes

修正

2020/05/23 13:00

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -61,8 +61,10 @@
 ```
 ![イメージ説明](f3d3d3b5222c36db5aaebdabc0a12709.jpeg)
+色は分類超平面からの距離を表す
 この図の等高線を描画しているのが以下です。
+等高線を引く位置は `dec.min(), 0, dec.max()` の3つにしており、dec==0 の等高線が分離超平面からの距離が0ということなので、つまり、これが分離超平面になります。
 ```
 plt.contourf(

修正

2020/05/23 13:00

投稿

tiitoi

スコア21960

answer CHANGED Viewed

@@ -17,11 +17,11 @@
 > 以下15行目のコードでXX,YYの右にdec.reshape(XX.shape)が入るのはなぜでしょうか。これは(2500,)のdecを(50,50)にしているようですが、なぜXX,YY,ZZではないのでしょうか。
-dec.reshape(XX.shape) としているのは、contourf() の仕様上、dec の形状は (2500,) を XX, YY に合わせて (50, 50) にしなければいけないためです。
+dec.reshape(XX.shape) としているのは、contourf() の仕様上、dec の形状 (2500,) を XX, YY に合わせて (50, 50) にしなければいけないためです。
 ## コードの流れ解説
-x, y を実数としたとき、特徴空間 S = (x, y, y**2) 上のデータについて、今回考えています。特徴空間 S 上から適当な個数のサンプルを以下で生成しています。
+特徴空間 S = {(x, y, y**2)|x∈ℝ, y∈ℝ} 上のデータについて、今回考えています。特徴空間 S 上から適当な個数のサンプルを以下で生成しています。
 ```python
 import matplotlib.pyplot as plt
@@ -41,7 +41,7 @@
 ![イメージ説明](360d395eb04a70afec407c4e1556821d.jpeg)
-青の曲面が特徴空間、点が生成されたサンプル
+青の曲面が特徴空間、黄色、黒の点が生成されたサンプル
 SVM の学習は、データ `X_new` とラベル `y` を渡して、以下で行っています。