下図のようなデータフレームdfがあるとき、T列に対する各列の相関係数が一定値を下回る場合は、そのカラムを消去して新たにdfaというデータフレームを作りたいのですが、関数等うまく考え付きません。
||A|B|C|D|E|T
|:--|:--:|--:|
|1|45|-0.598|120.013|30.874|0.045|23
|2|23|0.984|-10.432|50.856|0.015|53
|3|3|23.44|-40.432|40.856|320.015|67
実際のdfは行が数千行、列も何千列もあり、すべて数値化されているおり、df.corr()でマトリクスは表示されるのですが、当然のように省略表示です。to_excelで落として該当列名を抽出して、個別にdropさせようとしたのですが、多すぎて対応に苦慮しています。どのように考えてコードを作ればよいのかご教示いただけませんでしょうか。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2017/12/17 05:42