グループ数が可変な時の、グループ名の付け方

Question

【質問】
・n等分されたデータセットに対して、ある指標に基づき「データ1」「データ2」…「データn」と名前を付けたい場合、どういった表記をすれば良いのか、ご教授頂きたいです。
※nの数値が決まっている場合は、label等を用いれば出来ると思うのですが、nが可変な場合、どういった処理をすれば良いのでしょうか？

⇓該当するデータと関数の表記

【前提】
ある顧客データ（Data_A）に対して、合計金額（TotalPrice）を分位点でn等分します。（nは自然数で可変）

```ここに言語を入力
#今回用いるデータ
df = Data_A

#同じCustomerIDを持つ場合、それらデータの和をとる
df1 = df[['CustomerID', 'TotalPrice']].groupby('CustomerID').sum().reset_index()

#TotalPriceが大きい順に並べる
df2 = df1.sort_values(by='TotalPrice', ascending=False)

#上記のデータをn等分して、グループごとの合計値をとる
df3 = df2.groupby(pd.qcut(df2['TotalPrice'], n, duplicates = 'drop')).sum()

#それぞれの合計値が、データ全体の何％か表記する
df3['Ratio(%)'] = (df3['TotalPrice'] * 100 / df['TotalPrice'].sum()).round(2)
```

例えばn=4のとき、下記のようなデータになっています。
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-05-18/da6e4634-515a-4cd1-9992-e91f951b9764.png)

これらのグループに対して、「TotalPrice」が大きい順に「グループ1」「グループ2」…「グループn」と名前を付けたいのですが、どういった方法をとれば良いのでしょうか？

どなたかご教授頂けると幸いです。

Accepted Answer

```python
df3['Group'] = \
  df3['TotalPrice'].rank(ascending=False).astype(int).apply(lambda x: f'グループ{x}')

CustomerID  TotalPrice  Ratio(%)      Group
TotalPrice                                                       
(27980.999, 50996.0]          16      118716     24.03  グループ3
(50996.0, 56850.0]            10      109800     22.23  グループ4
(56850.0, 64256.0]             6      123053     24.91  グループ2
(64256.0, 74717.0]            13      142443     28.83  グループ1
```

関連した質問