回答編集履歴

typoの修正

2020/07/19 22:02

投稿

yymmt

スコア1615

answer CHANGED Viewed

@@ -74,7 +74,7 @@
 ```
 np.newaxisは次元を1つ追加しますので
 ```python
-explained_variance_[:, np.newaxis] == (P, 1)
+explained_variance_[:, np.newaxis].shape == (P, 1)
 ```
 と2次元配列になります。要素数P個は変わりません。

質問に答えていなかったため追記

2020/07/19 22:02

投稿

yymmt

スコア1615

answer CHANGED Viewed

@@ -1,3 +1,5 @@
+#### PCA.inverse_transform()の動作
 PCA.transform()は主成分(分散の大きな軸)を見つけてそれを主軸とするような変換を行います。変換された値に対してPCA.inverse_transform()を行うと、元の変換される前の値を返します。
 例として2次元平面上での理想的な楕円をPCA.transform()を行うとどうなるか、そしてさらに変換された値にPCA.inverse_transform()を行うとどうなるかを示します。
@@ -44,4 +46,49 @@
     main()
 ```
-![PCA.inverse_transform()の実験](98ed48234adbfa4ab26743d3bb802827.png)
+![PCA.inverse_transform()の実験](98ed48234adbfa4ab26743d3bb802827.png)
+#### 低次元から高次元へ戻る仕組み
+簡単に言うと、N個のデータ、M個の特徴量に対してP次元のPCAを適用した場合
+(N x P) = (N x M) (M x P)  # (変換後) = (変換前) (変換行列)
+となっています。変換行列(M x P)を覚えておいて、inverse_transform()する際には
+(N x M) = (N x P) (P x M)  # (変換前) = (変換後) (変換行列の転置行列)
+を行っているだけです。
+ソースコードの方を参照されているので詳しく説明します。入力データX0のデータ数をN, 特徴量の数をMとすると
+```python
+X0.shape == (N, M)
+```
+です。これにPCAの要素数をPとすると、pca.transform()後のX1は
+```python
+X1.shape == (N, P)
+```
+となります。このときPCAの内部ではfit()時に各々分散を計算して大きい順にP個保持しています。
+```python
+explained_variance_.shape == (P, )  # 1次元配列
+```
+np.newaxisは次元を1つ追加しますので
+```python
+explained_variance_[:, np.newaxis] == (P, 1)
+```
+と2次元配列になります。要素数P個は変わりません。
+また主成分の係数`components_`は
+```python
+components_.shape == (P, M)
+```
+になっています。この2つを掛け算すると
+```python
+(explained_variance_[:, np.newaxis] * components_).shape == (P, M)
+```
+となります。これはP個の分散の値をcomponents_の各行に掛け算しています。
+np.sqrt()は次元を変えませんので、最終的に
+```
+np.dot(X, np.sqrt(self.explained_variance_[:, np.newaxis])
+```
+を計算することができます。Xは次元が減ったX1.shape == (N, P)のことですので、内積は(N, P) . (P, M) となり、演算結果の行列は(N, M)となります。

typoの修正

2020/07/19 21:57

投稿

yymmt

スコア1615

answer CHANGED Viewed

@@ -1,4 +1,4 @@
-PCA.transform()は主成分(分散の大きな軸)を見つけてそれを主軸とするような変換を行います。変換された値に対してPCA.inverse_transform()を行うと、元の回転される前の値を返します。
+PCA.transform()は主成分(分散の大きな軸)を見つけてそれを主軸とするような変換を行います。変換された値に対してPCA.inverse_transform()を行うと、元の変換される前の値を返します。
 例として2次元平面上での理想的な楕円をPCA.transform()を行うとどうなるか、そしてさらに変換された値にPCA.inverse_transform()を行うとどうなるかを示します。

回転とも少し違う、どちらかと言えば投影のが近い

2020/07/19 17:41

投稿

yymmt

スコア1615

answer CHANGED Viewed

@@ -1,4 +1,4 @@
-PCA.transform()は主成分(分散の大きな軸)を見つけて軸を回転した値を返します。回転された値に対してPCA.inverse_transform()を行うと、元の回転される前の値を返します。
+PCA.transform()は主成分(分散の大きな軸)を見つけてそれを主軸とするような変換を行います。変換された値に対してPCA.inverse_transform()を行うと、元の回転される前の値を返します。
 例として2次元平面上での理想的な楕円をPCA.transform()を行うとどうなるか、そしてさらに変換された値にPCA.inverse_transform()を行うとどうなるかを示します。

正規化ではなく回転に修正

2020/07/19 17:40

投稿

yymmt

スコア1615

answer CHANGED Viewed

@@ -1,4 +1,4 @@
-PCA.transform()は主成分(分散の大きな軸)を見つけて正規化された値を返します。正規化された値に対してPCA.inverse_transform()を行うと、元の正規化される前の値を返します。
+PCA.transform()は主成分(分散の大きな軸)を見つけて軸を回転した値を返します。回転された値に対してPCA.inverse_transform()を行うと、元の回転される前の値を返します。
 例として2次元平面上での理想的な楕円をPCA.transform()を行うとどうなるか、そしてさらに変換された値にPCA.inverse_transform()を行うとどうなるかを示します。