前提・実現したいこと
欠損値補完方法である多重代入法をサポートするstatsmodels.imputation.miceを用いたコードを書いています。
私は複数台のPCを有しており、あるPCではうまく補完ができることまでは確認できました。そこで、補完性能を確認するために他方のPCにコードを移植して実行したところ、エラーが発生しており、原因と回避策を知りたく思います。
発生している問題・エラーメッセージ
発生したエラーメッセージは以下です。
メッセージよると、DataFrameオブジェクトに'update_all'というアトリビュートはないとことなのですが、私自身、DataFrameにupdate_allというメソッドがあるという認識がないので、なぜ、こうしたエラーが発生しているのかが見当がつかない状態です。
AttributeError Traceback (most recent call last) <ipython-input-9-30e0dc721bec> in <module> 3 4 MICE_Model = mice.MICE(model_formula='math score ~ reading score',model_class=sm.OLS,data=tmp) ----> 5 MICE_Model.fit(10,100) ~\Anaconda3\lib\site-packages\statsmodels\imputation\mice.py in fit(self, n_burnin, n_imputations) 1229 1230 # Run without fitting the analysis model -> 1231 self.data.update_all(n_burnin) 1232 1233 for j in range(n_imputations): ~\Anaconda3\lib\site-packages\pandas\core\generic.py in __getattr__(self, name) 5055 if self._info_axis._can_hold_identifiers_and_holds_name(name): 5056 return self[name] -> 5057 return object.__getattribute__(self, name) 5058 5059 def __setattr__(self, name, value): AttributeError: 'DataFrame' object has no attribute 'update_all'
該当のソースコード
python
1import statsmodels.imputation.mice as mice 2import statsmodels.api as sm 3 4tmp = missing_cont_data[['math score','reading score']] 5MICE_data = mice.MICEData(tmp) 6 7MICE_Model = mice.MICE(model_formula='math score ~ reading score',model_class=sm.OLS,data=tmp) 8MICE_Model.fit(10,100)
試したこと
正常に処理できたPCとエラーが発生したPCの環境の問題かと思い、statsmodelsとpandasのバージョンは揃えました。
おそらく、他にもそろえるべきものがある気がしますが、上記のエラーメッセージでは対象が絞り込めないので未実施です。
補足情報(FW/ツールのバージョンなど)
処理対象のデータを一部示します。
'math score','reading score','writing score'
72, 72, 74
69, 90, 88
90, 95, 93
47, 57, 44
先のコードには記載していませんが、上記のCSVファイルをpandasのread_csvで読み込んで処理しています。また、欠損値は元にデータにはなく、プログラムにてnp.nanを埋め込んでいます。(真値とmiceによる補完値を比較するため)
その他の関連しそうな情報は以下です。
os : windows10(64bit)
python : 3.6系
statsmodel : 0.9.0
pandas : 0.22.0
回答1件
あなたの回答
tips
プレビュー