主成分分析の次元削減に関して学習しています
そこで分からないことがあるので質問させてください
※scikit-learnのPCAを使ってコードを書いています
①特徴量が30個あるデータを2つの主成分だけ維持するとした場合
この2つというのは30個ある特徴量のなかで1番分散が大きい特徴量、2番目に分散が大きい特徴量を維持する
という認識はあっているでしょうか?
②以下のように主成分を見れるコードを作成したのですが、2つの主成分に対して30個の特徴量を指しているのかなと考えるのですが
ここで表示されている30個の値は何を示しているのでしょうか?
また、2つの主成分とされているものはどの特徴量を指している、というのはどう判断するのでしょうか(そもそも①の理解が間違っているかもしれません)
理解が出来ておらず的外れな質問をしていると思いますがアドバイス宜しくお願い致します。
python
1print('PCA components shape : {}'.format(pca.components_.shape)) 2#PCA components shape : (2, 30) 3 4print('PCA components : \n {}'.format(pca.components_)) 5 6#PCA components : 7 [[ 0.21890244 0.10372458 0.22753729 0.22099499 0.14258969 0.23928535 8 0.25840048 0.26085376 0.13816696 0.06436335 0.20597878 0.01742803 9 0.21132592 0.20286964 0.01453145 0.17039345 0.15358979 0.1834174 10 0.04249842 0.10256832 0.22799663 0.10446933 0.23663968 0.22487053 11 0.12795256 0.21009588 0.22876753 0.25088597 0.12290456 0.13178394] 12 [-0.23385713 -0.05970609 -0.21518136 -0.23107671 0.18611302 0.15189161 13 0.06016536 -0.0347675 0.19034877 0.36657547 -0.10555215 0.08997968 14 -0.08945723 -0.15229263 0.20443045 0.2327159 0.19720728 0.13032156 15 0.183848 0.28009203 -0.21986638 -0.0454673 -0.19987843 -0.21935186 16 0.17230435 0.14359317 0.09796411 -0.00825724 0.14188335 0.27533947]]

回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/09/05 01:51 編集
2018/09/05 09:51