前提
https://osaka-hk.org/posts/toukei_mikata04
を読み欠損値の穴埋めを多重代入法を利用したいと考えています。
以下多重代入法のイメージ図
実現したいこと
欠損値を多重代入法(Multiple Imputation)で埋めたいと思っています。
そこでpythonのライブラリscikit-learnではIterativeImputerで実現しようとしています。
該当のソースコード
IterativeImputerのパラメータsample_posterior=True
と設定することで多重代入法になっていると認識しているのですが、合っているでしょうか?
この方法では多重代入法になっておらずm回実行することでモデルをm個作成し、平均値をとるなどの処理が必要でしょうか?
python
1from sklearn.experimental import enable_iterative_imputer 2from sklearn.impute import IterativeImputer 3IterativeImputer(sample_posterior=True).fit_transform([[1, 2], [2, 4], 4 [3, 6], 5 [np.nan, 8], 6 [5, np.nan]]))
補足情報
Imputing missing values using sklearn IterativeImputer class for MICE
上記のURLではモデルを複数作成していました。しかし、下記のURLでは単一のモデルのみでした。
multiple imputation について
回答1件
あなたの回答
tips
プレビュー