回答率: 85.30%

質問するログイン新規登録

トップ Pythonに関する質問機械学習に次元削減を取り入れる時について

編集履歴

回答編集履歴

3

edit

2018/04/09 13:17

投稿

スコア8562

test CHANGED Viewed

@@ -29,3 +29,23 @@
 X_test = lda.transform(X_test)
 ```
+---
+面白かった読み物。
+https://stats.stackexchange.com/questions/106121/does-it-make-sense-to-combine-pca-and-lda
+https://spiral.imperial.ac.uk/bitstream/10044/1/33407/11/LiuGillies2015AcceptedAuthorManuscript.pdf
+https://stats.stackexchange.com/questions/169436/how-lda-a-classification-technique-also-serves-as-dimensionality-reduction-tec
+https://stats.stackexchange.com/questions/65692/how-to-visualize-what-canonical-correlation-analysis-does-in-comparison-to-what/65817#65817
+http://sebastianraschka.com/Articles/2014_python_lda.html

2

edit

2018/04/09 13:17

投稿

スコア8562

test CHANGED Viewed

@@ -1,8 +1,10 @@
-本番環境によりますが、次元削減する際に必ず予測しようとしているデータを持っていることを保証できるのであれば、全部まとめて次元削減を行っても問題ありません（宗派あり）。
+~~本番環境によりますが、次元削減する際に必ず予測しようとしているデータを持っていることを保証できるのであれば、全部まとめて次元削減を行っても問題ありません（宗派あり）。
+予測しようとするデータを常に含めて次元削減ができないのであれば、本番環境に近づけるためにモデルのフィッティングに関わるデータのみで次元削減するのが無難です。~~
-予測しようとするデータを常に含めて次元削減ができないのであれば、本番環境に近づけるためにモデルのフィッティングに関わるデータのみで次元削減するのが無難です。
+LDAを使う場合、まとめて次元削減を行うと必ずリークしますね。

1

edit

2018/04/09 12:41

投稿

スコア8562

test CHANGED Viewed

@@ -3,3 +3,27 @@
 予測しようとするデータを常に含めて次元削減ができないのであれば、本番環境に近づけるためにモデルのフィッティングに関わるデータのみで次元削減するのが無難です。
+---
+(1)の方はtestデータに対してLDAを計算し直したらだめでは？
+```python
+lda = LDA(n_components=2)
+lda.fit(X_train, y_train)
+X_train = lda.transform(X_train)
+X_test = lda.transform(X_test)
+```