回答率: 85.25%

質問するログイン新規登録

トップ Pythonに関する質問 Pythonでの表の作成について

編集履歴

回答編集履歴

1

回答を転記

2019/03/28 11:50

投稿

スコア15898

answer CHANGED Viewed

@@ -1,6 +1,32 @@
-すみません
-こちらの質問に気づかずに
 [http://teratail.com/questions/181382](https://teratail.com/questions/181382)
+にも書いておりますが、まず 国、銘柄毎に point,price 列の最大・平均．最小の値を求める方法は ``Groupby.agg()`` を使って
+```Python
+df.groupby(['country','variety']).agg({'price':['min','mean','max'], 'points':['min','mean','max']})
+```
-のコメント欄に回答してしまいましたので、こちらを参照ください、
+となり、これと同時に descriptionの数をカウントするためには、
+```Python
+tmp_df = df.groupby(['country','variety']).agg({'price':['min','mean','max'], 'points':['min','mean','max'],'description':'count'})
+```
+とでもすると良いわけです。
-> 後からこの質問を閲覧する方もおられるかと思いますので、あとでこちらにも正式に回答を転記したいと思いますがとりあえず。
+あとは上記の DataFrame から 国ごとに description の数が最大な行を抜き出すとよいわけですが、
+これは上記のデータフレーム(``tmp_df``) に対して再度、国ごとに groupby() を使って行うことができます。
+具体的なコードをわかりやすく　for文を使って書くと
+```Python
+# 国毎に選択された銘柄の行を格納するリスト
+dfs = []
+# groupby() によって国毎のデータでループ
+for country, data in tmp_df.groupby('country'):
+    # description数が最大な行のIndexを求める
+    idx = data[('description','count')].idxmax()
+    # 上の行をリストに格納
+    dfs.append(tmp_df.loc[[idx]])
+# リスト内のデータを結合してデータフレームを再構築
+result = pd.concat(dfs)
+```
+となるかと思います。