python初学者です。また、統計の勉強についても不足していると自覚しております。
今回はpythonによって手持ちのデータのロジスティック回帰分析を行っていた所、数カ所で行き詰まり、疑問が生じているので、ご回答頂けますと幸いです。
こちらの画像にあるとおり、OUT[5]にあるようなdfというファイルを読み込み(実際のn数276)、
目的変数を"outcome"、説明変数を"sex","age","a","b",・・・,"m"としてロジスティック回帰分析をしたいと思っています。
In[7]のように正解率を出して、過学習が起きてないことを確認し、
の様に各説明変数のオッズ比を出しました。(方法A)
また、別のサイトを参考に以下の様にコマンドを記述しても行いました。
ここのcoef_の一つ一つに以下の様に計算すとオッズ比がでるのかと思います。(方法B)
ここで幾つか疑問(行き詰まり)があります。
①方法Aと方法Bでは、それぞれの説明変数のオッズ比がずれている様なのですが、その理由がわかりません
②各説明係数のオッズ比を出す際のp値を出すことは出来ませんでしょうか?
③In[7]の部分で、"sex","age"を除いているのですが、それらを入れると以下の様なerrorが出てしまいます。
"sex"や"age"がfloat型でないからかと思いますが、こちらを解消する方法はありますでしょうか?
長文となり、申し訳ありませんが、ご回答頂けますと幸いです。
何卒宜しくお願い申し上げます。
回答3件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/24 15:48