回答編集履歴

回答に追記

2019/04/01 00:37

投稿

magichan

スコア15898

test CHANGED Viewed

@@ -61,3 +61,111 @@
 #333 製品CCC  0.5  3000      2    (A1, A2)
 ```
+---
+**【追記】**
+上記のコードを 先に ``groupby()`` してから ``agg()`` の中で "箱"と"ふくろ"を処理しないように修正してみます。
+```Python
+def conv_parts_to_tuple(d):
+    return tuple(d[~d.isin(['箱', 'ふくろ'])])
+def num_of_parts(d):
+    return d[~d.isin(['箱', 'ふくろ'])].count()
+res = df.groupby(['品番','品名']).agg(
+    {
+        '単価':'first',
+        '生産数':'first',
+        '部品': [ num_of_parts,
+                  conv_parts_to_tuple,]
+    })
+res.columns = ['単価','生産数','部品項目数','部品一覧']
+```
+やっていることはほとんどど同じなのですが、 ``agg()``内で２つのlambda(無名関数)を指定することが困難そうだったので、関数として切り出して処理しております。
+"箱"と"ふくろ"の処理部が２つの関数に含まれて若干冗長な感じはあるのですが、この程度であればまあ個人的には問題ないかと思います。
+ただ複数個の関数を切り出す必用があるのであれあ、``apply()``を使って１つの関数で処理したほうがシンプルになる気もしますね・・。
+やってみます。
+```Python
+def fnc(row):
+    tmp = row.loc[~row['部品'].isin(['箱', 'ふくろ']), '部品']
+    return pd.Series(
+        {
+            '単価': row['単価'].iat[0],
+            '生産数': row['生産数'].iat[0],
+            '部品項目数': tmp.count(),
+            '部品一覧': tuple(tmp)
+        })
+res = df.groupby(['品番','品名']).apply(fnc)
+print(res)
+```
+> ``apply()``の場合は Series型のデータを返すことで列を構成します。
+この方法であれば
+- "箱"と"ふくろ"の処理部を共通化できる
+- Column名を直に指定できるため変更の必要がない
+のですこしシンプルになります。まあ、好みの問題ではありますが。。