回答率: 85.30%

質問するログイン新規登録

トップ機械学習に関する質問 python 主成分分析（PCA）について

編集履歴

回答編集履歴

2

修正

2018/09/04 04:40

投稿

スコア30939

answer CHANGED Viewed

@@ -22,7 +22,7 @@
 >>> X = pca.fit_transform(iris.data)
 >>> X[0]  # 0番目の変換後のデータ
 array([-2.68420713e+00,  3.26607315e-01, -2.15118370e-02,  1.00615724e-03])
->>> np.matmul(iris.data - iris.data.mean(axis=0), pca.components_.T)[0] # 平均を引いてセンタリングして、pca.components_を転置したものと行列積を計算し、0番目を取り出す
+>>> np.matmul(iris.data - iris.data.mean(axis=0), pca.components_.T)[0] # データから平均を引いてセンタリングして、pca.components_を転置したものと行列積を計算し、0番目を取り出す
 array([-2.68420713e+00,  3.26607315e-01, -2.15118370e-02,  1.00615724e-03])
 ```

1

追記

2018/09/04 04:40

投稿

スコア30939

answer CHANGED Viewed

@@ -8,4 +8,22 @@
 「棒」の上にあれば1次元で表現できます（棒の曲がりや太さは考えないものとする）。この場合も同様。
-主成分を削減後の空間の基底にしたいので、主成分が直交するような表現を作ります。これは共分散行列を固有値分解して固有ベクトルを得れば良いのですね。
+主成分を削減後の空間の基底にしたいので、主成分が直交するような表現を作ります。これは共分散行列を固有値分解して固有ベクトルを得れば良いのですね。
+### 追記
+components_から削減後のデータ（いわゆる主成分得点）を生成するのは簡単です。
+```python
+>>> import numpy as np
+>>> from sklearn.decomposition import PCA
+>>> from sklearn.datasets import load_iris
+>>> iris = load_iris()
+>>> pca = PCA()
+>>> X = pca.fit_transform(iris.data)
+>>> X[0]  # 0番目の変換後のデータ
+array([-2.68420713e+00,  3.26607315e-01, -2.15118370e-02,  1.00615724e-03])
+>>> np.matmul(iris.data - iris.data.mean(axis=0), pca.components_.T)[0] # 平均を引いてセンタリングして、pca.components_を転置したものと行列積を計算し、0番目を取り出す
+array([-2.68420713e+00,  3.26607315e-01, -2.15118370e-02,  1.00615724e-03])
+```
+transformを呼ぶと、こういう処理がなされると。