データセットから、出現頻度の高い項目すべてを含むデータのみを抜き出したいです。例えば
--a b c d e f
A 0 1 0 0 0 1
B 0 1 1 0 1 0
C 1 0 0 0 0 0
D 1 1 1 1 0 0
E 1 0 1 0 0 1
F 0 1 0 0 0 0
以上のようなデータセットがあった時、a~fの項目で出現頻度の高い3つ→a,b,c
そしてデータセットの中で、この出現頻度の高いabcをすべて含むデータ→D
このような流れで、上記で言うDのデータを抜き出したく(実際にはもっと大きなデータセットで複数出てくると思いますが)、何か良い方法をご存知の方がいらしたら、どのようにコーディングしてよいものか教えていただきたく思います。
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/09/18 02:30