pandasの中に配列を入れたのですが、その配列内の文字列を対象に操作をしたいです。
ループ文を使えば簡単に実現できるとは思いますが、pandasに格納した意味が薄れてしまうので、pandasの関数を組み合わせて、キレイに実行する方法を探しております。
もしご存知でしたら教えていただきたいです。
行いたい操作をデータ例を交えて下記に説明します。
#データ例
データは下記のようなデータです。
(Z列は、チェックボックスからのデータを格納したものであり、同じ文字列が同じ配列内に2つ登場することはありません。)
python3
1>>> df.keys() 2Index(['X', 'Y', 'Z'], 3 dtype='object') 4>>> df 5 X Y Z 60 5 0 [A, B] 71 10 1 [C] 83 30 1 [A] 94 25 2 [A, B, C] 105 15 0 [] 11[5 rows x 3 columns]
#実行したい操作
① 列Zの配列の文字数の出現数カウント(出現行数カウント)
python3
1A 3 2B 2 3C 2
② 列Zの配列内の文字列Aでフィルターしたdf_A
pandas型にできれば更にあとは自分で細かい操作ができるのでありがたいです。
python3
1>>> df_A 2 X Y Z 30 5 0 [A, B] 41 30 1 [A] 52 25 2 [A, B, C] 6[3 rows x 3 columns]
③ 列Zの配列の文字列ごとのグループ集計
python3
1A 60 3 2B 30 2 3C 35 3

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/04/23 01:20