dataframeを任意の行にしたい

Question

### 前提・実現したいこと
df_2の"num"の数値をdf_1にある"categoryの個数毎に上位の数値順に取得した列をdf_1に追加し、df_3を作りたいと考えていますが、方法がわかりません。

教えていただけないでしょうか


### 該当のソースコード

```python
import pandas as pd
import numpy as np
#実行前のデータ
data_1 = {"category":["a","a","a","b","b","c","c","c","c"]}
df_1 = pd.DataFrame(data_1)

data_2= {"category":["a","a","a","a","b","b","b","b","c","c","c","c"],"num":[10,8,5,3,6,5,4,3,13,9,5,2]}
df_2 = pd.DataFrame(data_2)

#実行後のイメージ
data_3={"category":["a","a","a","b","b","c","c","c","c"],"num":[10,8,5,6,5,13,9,5,2]}
df_3= pd.DataFrame(data_3)
```
修正

df_1をdf_2の数値に基づいて、df_3にしたいと考えています。

Accepted Answer

あまりスマートな方法が見つかりませんが、とりあえず２通り


**１．** ``DataFrame.groupby()``にてループを使う方法

```Python
for cat, d in df_1.groupby('category'):
    # df_2 より同一カテゴリーの 'num'を取得し、一応降順にソートしておく
    nums = df_2.loc[df_2['category']==cat, 'num'].sort_values(ascending=False).values
    # df_1 の同一カテゴリーに上のデータをサイズを合せて追加する
    df_1.loc[d.index, 'num'] = nums[:len(d)]
# 型をintに修正
df_1['num'] = df_1['num'].astype('int')
```


**２.** ``pandas.merge()`` を使う方法

```Python
# df_1 に各カテゴリー毎にインデックス番号をふっておく
df_1['cat_idx'] = df_1.groupby('category', group_keys=False).apply(lambda d: pd.Series(range(len(d)), index=d.index))
# df_1 にも同様に各カテゴリー毎にインデックス番号を振っておく（'num'の値が降順にになるようにインデックスをふる）
df_2['cat_idx'] = df_2.groupby('category', group_keys=False).apply(lambda d: pd.Series(range(len(d)), index=d.sort_values('num', ascending=False).index))
# categoryとcat_idx(カテゴリー毎のインデックス番号)が同一のもので df_1 と df_2 をマージ
df_3 = pd.merge(df_1, df_2, on=['category', 'cat_idx'])
# cat_idxは不要となるので削除
df_3 = df_3.drop('cat_idx', axis=1)
```

前提・実現したいこと

該当のソースコード

関連した質問