python 最適化問題(?)について

pythonで最適化問題(?)を考えております。

data.csv
id,id2,cost
1,10,5
2,10,3
3,10,1
1,13,10
2,13,5
3,13,4
1,18,1
2,18,5
3,18,10
1,20,10
2,20,5
3,20,4
1,25,10
2,25,1
3,25,5

list.csv
id2,min
10,
13,
18,
20,
25,
29,
35,
48,

上記のdata.csvとlist.csvでdata.csvのid2に着目してcostが最小となる値をlist.csvのminに出力するスクリプトは以下で表せると思います。

python
1import pandas as pd
2
3df = pd.read_csv("data.csv")
4
5conv = df.groupby("id2")["cost"].min()
6
7df1 = pd.read_csv("list.csv")
8ret = df1["id2"].map(conv)
9
10df1["min"] = ret
11print(df1)

ここで、id2がminを取る時のdata.csvのid（1,2,3）にも着目し、同じid番号を取れる回数に制限を設け（id:1⇒２回、id2⇒２回、id3⇒１回）、最小値を取るid番号が制限に達した場合、そのidの時にminを取る場合であっても、制限に達していないidのうちから最小値を選択するようにするにはどのように変更したらよいでしょうか。

list.csv
id2,min
10,1
13,5
18,1
20,5
25,10
29,
35,
48,

のように出力したいです。
id2が10の時は最小値が1なのでlist.csvのminには１が出力されます。
（この時のidは３⇒制限回数１回に達したので最小値であってもidが３のものは、これ以降使用できない）
id2が13の時の最小値は4ですが、id3のものは使用できない為、2番目に小さい5をlist.csvのminに出力します。（この時のidは２）
（最後の方になると、使用できるidの制限でmaxがlist.csvのminに出力されることもあり得ます。。。）
このようにlist.csvの上から５番目までこの動作を繰り返すにはどのように変更したらよろしいでしょうか。
なお、list.csvの６番目以降のminに関しては出力しなくて結構です。（id:1,2,3の制限の合計が５である為、６番目以降は全てのidが制限に達する為です。）

ご教授いただけましたら幸いです。
よろしくお願いいたします。

行動規範の内容に同意します

回答1件

Julia言語ならこんな感じでしょうか? しょぼい実装ですみません。

julia
1using CSV
2using DataFrames
3
4df = CSV.File("data.csv") |> DataFrame
5df2 = CSV.File("list.csv") |> DataFrame
6
7df2.min = begin
8    lm = Dict(1 => 2, 2 => 2, 3 => 1); # 制限
9    # id毎の最小値カウンタ
10    nd = Dict([(k, 0) for k in keys(lm)])
11
12    # min
13    mn = Vector{Union{Missing, Int64}}(missing, nrow(df2))
14    for k_row in 1:nrow(df2)
15        id2 = df2.id2[k_row]
16        # id毎の最小値チェック
17        id_match = [k for k in keys(lm) if nd[k] < lm[k]]
18        # 最小値の条件が無くなったら終了
19        if length(id_match) == 0
20            break;
21        end
22        # id2一致 & 最小値条件満たす行
23        r_match = filter(r -> r.id2 == id2 && r.id in id_match, df);
24        idx_min = argmin(r_match.cost); # 最小値の行
25        nd[r_match.id[idx_min]] += 1; # 最小値を取ったidのカウンタアップ
26        mn[k_row] = r_match.cost[idx_min];
27    end
28    mn
29end
30
31println(df2)
32CSV.write("list.csv", df2)