[欠損値処理]列ごとの初めと終わりの欠損値を削除したい

実現したいこと

列ごとの初めと終わりに並ぶ欠損値を削除したい

該当のソースコード

python
1df = pd.DataFrame(np.arange(35).reshape(7, 5),
2                  columns=['col_0', 'col_1', 'col_2', 'col_3', 'col_4'],
3                  index=['row_0', 'row_1', 'row_2', 'row_3', 'row_4','row_5','row_6'])
4
5df = df.replace([0,2,3,4,5,7,9,10,13,19,27,28,29,31,32,33], np.nan)

以上のようなデータの際に,

python
1 col_0: 15、20、25、30
2 col_1: 1、6、11、16、21、26
3 col_2: 12、17、22
4 col_3: 8、NaN、 18、23
5 col_4: 14,NaN,24,NaN,34

となるような処理をしたいです。
この処理はdf全体に対する処理ではなく、指定した列のみにする処理になります。

試したこと

欠損値処理について調べてみましたが、欠損値を全て削除するものしか見つけることができませんでした。

補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。

TakaiY

2022/11/24 09:05

「となるような処理をしたいです。」で挙げられているデータは、カラム毎にデータ数が違うので、dfとして成立しませんが、どのようなデータが得たいのでしょうか。

drango

2022/11/24 09:16

質問いただきありがとうございます。挙げたのはデータではなくて、カラム毎に抽出したときに得たい値になります。何らかの関数(df['col_0'])としたときに得られた値です。

行動規範の内容に同意します

回答1件

ベストアンサー

python
1ser = df.apply(lambda x: x[x.first_valid_index():x.last_valid_index()].values)
2print(ser)
3
4#
5# col_0              [15.0, 20.0, 25.0, 30.0]
6# col_1    [1.0, 6.0, 11.0, 16.0, 21.0, 26.0]
7# col_2                    [12.0, 17.0, 22.0]
8# col_3                [8.0, nan, 18.0, 23.0]
9# col_4          [14.0, nan, 24.0, nan, 34.0]
10# dtype: object