Rで欠損値処理をしている方には有名らしい、MICEという欠損値補完手法を、Pythonで試そうとしています。メソッドは、statsmodels.imputation.miceの中にあるものを使用します。
【質問】
実際にどのようなコードを書けば、データフレームの欠損値を補完できるのか?
下記リンク先のドキュメントとソースコードの例を読み込みましたが、いまいちやり方が理解できませんでした。
【MICEモデルの概要の説明リンク】http://www.statsmodels.org/dev/generated/statsmodels.imputation.mice.MICEData.html
【MICEモデルのソースコード】
http://www.statsmodels.org/dev/_modules/statsmodels/imputation/mice.html#MICEData
【データフレームの性質】
コラムの数:237
行の数:219395
【試したコード】
Python
1#ライブラリ 2#Libraries 3import pandas as pd 4import statsmodels.regression.linear_model as sm 5from statsmodels.imputation.mice import MICE,MICEData 6#欠損値補完 7new_df = df.copy() 8imp = MICEData(new_df) 9fml = 'y ~ x1 + x2 + x3 + x4' 10mice = MICE(fml, sm.OLS, imp)
よろしくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。