前提・実現したいこと
SPSSを用いた論文で使われている「成分行列」の意味を調べるために,SPSSで行われた主成分分析(PCA)の実験に対して,pythonで実験結果を再現することを目的としています.
使用データ・実験結果は以下のサイトを参考にしています.
引用テキスト心理データ解析 補足説明(1)
http://www.f.waseda.jp/oshio.at/edu/data_b/add_folder/daad_01.html
発生している問題・エラーメッセージ
デバッグモードで確認していますが目的とする成分行列と一致する数値を見つけることができませんでした.
記事によると成分行列は重みとも表記されるらしく,主成分軸の係数の事かと考え出力してみましたが,SPSSの結果と異なります.
該当のソースコード
python
1df = pd.read_csv('spsstest.csv', sep=",", header=0) 2dfs = df.iloc[:, 1:] 3 4#主成分分析 5pca = PCA(n_components=2) 6ss = StandardScaler() 7p = Pipeline([("scaler", ss), ("pca", pca)]) 8feature = p.fit_transform(dfs) 9 10print(pca.components_) 11>[[ 0.43050837 0.40018394 0.38728871 0.40632246 0.40366084 0.42009855] 12 [-0.35381557 -0.38475142 -0.48763768 0.37781142 0.37104552 0.4
試したこと
このコードを用いた主成分分析の結果,累積寄与率は結果が一致していることを確認しています.(そのため,まったく異なる分析をしているというわけではないと考えています.)
よろしくお願いいたします.
回答1件
あなたの回答
tips
プレビュー