前提・実現したいこと
pythonでデータの欠損値の処理を以下のように行いたいです
何か便利な関数や方法はないでしょうか。
よろしくお願いします
データの特徴とやりたいこと
データは必ず各行に1つだけ、30から45までしかはいらない
欠損場所を連番で補完したい
ただし、取りうるデータの範囲外はNanのままにする
df_pre
a | b | c | d | e | |
---|---|---|---|---|---|
1 | Nan | Nan | 31 | Nan | Nan |
2 | Nan | 44 | Nan | Nan | Nan |
3 | Nan | Nan | Nan | 40 | Nan |
4 | Nan | Nan | Nan | Nan | 45 |
. | |||||
. | |||||
. |
df_post
a | b | c | d | e | |
---|---|---|---|---|---|
1 | Nan | 30 | 31 | 32 | 33 |
2 | 43 | 44 | 45 | Nan | Nan |
3 | 37 | 38 | 39 | 40 | 41 |
4 | 41 | 42 | 43 | 44 | 45 |
. | |||||
. | |||||
. |
試したこと
interpolateやfillna(method='bfill')等をつかって考えましたが、行ごとに欠損部分をすでにある数値を使って前後順番に連番に埋めていく手段が思いつきませんでした
補足情報(FW/ツールのバージョンなど)
python3.6.5
jupyter-notebook
回答1件
あなたの回答
tips
プレビュー