ラベル別ランキングをラベル数で割ったデータを求めたい

前提・実現したいこと

以下のようなラベルと元データに対して、ラベル別にランキングを付けた上で
ランク値＝ラベル別ランキング/ラベル別のデータ数
としてデータを返したいと考えています。

|ラベル|元データ|（返す値）ランク値|
|:--|:--:|
|A|2.1|0.333(=1/3)
|A|-1.5|1(=3/3)
|A|-0.1|0.666=(2/3)
|B|0.1|0.5(=3/6)
|B|4.5|0.167(=1/6)
|B|-3.0|1(=6/6)
|B|1.1|0.333(=2/6)
|B|-0.3|0.666(=4/6)
|B|-0.7|0.833(=5/6)
|C|-0.4|4/n
|・・・|・・・|

発生している問題・エラーメッセージ


ラベルに含まれるデータ数がラベルによって違うため
ランク値＝ラベル別ランキング/最も多いデータ数を持つラベルのデータ数
となってしまいます。
（下記はラベル「B」が最大のデータ数を持つものであった場合）

|ラベル|元値|ランク値|
|:--|:--:|
|A|2.1|0.167(=1/6)
|A|-1.5|0.5(=3/6)
|A|-0.1|0.333=(2/6)
|B|0.1|0.5(=3/6)
|B|4.5|0.167(=1/6)
|B|-3.0|1(=6/6)
|B|1.1|0.333(=2/6)
|・・・|・・・|

該当のソースコード

Python
1#イメージです
2import pandas as pd
3
4dataframe = ({'rabel': ['A','A','A','B','B','B','B','B','B'],
5                   'value': [2.1, -1.5, -0.1, 4.5, -3.0, 1.1, -0.3, -0.7, -0.4]})
6dataframe = pd.DataFrame(dataframe)
7
8divmax = lambda x: x / (x.max())
9rank_data = dataframe.groupby(['rabel'])['value'].rank().transform(divmax)
10rank_data

試したこと

別にラベルごとにデータ数の取得を行って割ればいいのですが、綺麗に処理する方向が分かりません。
上の処理を（データフレームを引数とした）関数にしたいのでなるべく簡素に書ければと思います。
よろしくお願いします。

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。|列1|列2|列3|
|:--|:--:|--:|
||||

行動規範の内容に同意します

回答2件

ベストアンサー

やりたいことは、こういうことですかね

Python
1import pandas as pd
2
3df = pd.DataFrame({
4    'label': ['A','A','A','B','B','B','B','B','B'],
5    'value': [2.1, -1.5, -0.1, 4.5, -3.0, 1.1, -0.3, -0.7, -0.4]})
6
7df['lavel_value'] = df.groupby('label').apply(lambda d:d[['value']].rank(ascending=False) / len(d))
8print(df)
9#  label  value  lavel_value
10#0     A    2.1     0.333333
11#1     A   -1.5     1.000000
12#2     A   -0.1     0.666667
13#3     B    4.5     0.166667
14#4     B   -3.0     1.000000
15#5     B    1.1     0.333333
16#6     B   -0.3     0.500000
17#7     B   -0.7     0.833333
18#8     B   -0.4     0.666667

投稿2019/05/20 15:57

編集2019/05/20 16:00

magichan

総合スコア15898

Forestone

2019/05/21 11:22

まさにこういう状態です！ありがとうございます。

行動規範の内容に同意します

python
1dataframe = ({'rabel': ['A','A','A','B','B','B','B','B','B'],
2                'value': [2.1, -1.5, -0.1, 4.5, -3.0, 1.1, -0.3, -0.7, -0.4]})
3dataframe = pd.DataFrame(dataframe)
4
5# 特定の要素の数をカウント
6count = (dataframe['rabel'] == 'A').sum()
7print(count)
8# 3