同じIDごとで欠損値以外の値をまとめ、バイタルサイン(BP, HRなど)の最小値を抽出するというプログラムを書きたいです。
→値があるセルをまとめて、一行にするというイメージです。
データフレームのイメージとしては、以下の通りです。
NaN = 欠損値
例えば、Fの患者は二行で異なるバイタルサインがあるので、値が低い方を抽出する
Fの患者は、SBP118, HR80, SpO2 98, RR18, AVPU 3326003のデータで1行になる
のような形です。
もう一点、
特定の列を指定して、その列の最小値を抽出することはできますでしょうか?
例えば、SBP118を抽出して、HRは110を抽出するなど
書いたコードはこちらです。
以前、こちらで教えていただきました。
一行にする、かつ時間の重複も無くしNaNを一行になるように補完する
df2 = pd.concat([x.fillna(method='bfill').iloc[[0]]for _, x in df.groupby('ID')])
よろしくお願い致します。
あなたの回答
tips
プレビュー