表題の件につきまして、例えば下記のデータで、回帰分析を実行すると、ラーメン店、和食、中華、イタリアンの内の1つが消されてしまうかと思います。
ID | Sales | 店舗タイプ |
---|---|---|
1 | 1930 | ラーメン店 |
2 | 2520 | 和食 |
3 | 1185 | ラーメン店 |
4 | 1460 | 中華 |
5 | 1770 | イタリアン |
6 | 930 | 中華 |
7 | 1890 | イタリアン |
8 | 2500 | 和食 |
9 | 3000 | 和食 |
質問としては2点あります。
- 消された項目は評点0という理解は正しいでしょうか?
例えば、解析結果が、{和食: 1100},{中華: -560},{イタリアン: 430}の場合はラーメン店を選択するとプラマイ0、和食を選択すると1100点高く、中華を選択すると560点低く、イタリアンを選択すると430点高く評価されるという解釈をしています。(数字は適当に当てただけで、実際に解析はしていません。)
- 項目を消されずに4項目とも表示させる方法はありませんでしょうか?もしくは、消される項目を自分で選ぶことは可能でしょうか?
どなたかご教示いただけますと幸いです。
回帰分析によって何を知りたいのでしょうか。質問を見る限り、そもそもこの手法の目的について大きく誤解しておられるんじゃないかという印象があります。
ご質問いただき、ありがとうございます。
上記の表では例としてのデータを書いてしまいました。
実際に検討している課題は下記の式です。
不動産利回り = β + α1 x 築年 + 構造* + 用途係数* + ・・・
この中で、構造はSRC造、RC造、S造、木造の4種類の分類になりますので、回帰分析を行う際にはダミー変数化されて、0もしくは1をとる別々の説明変数になると思います。
構造* = γ1 x SRC造かどうか(0 or 1)+ γ2 x RC造かどうか(0 or 1) + γ3 x S造かどうか(0 or 1) + γ4 x 木造かどうか(0 or 1)
Rで lm = (不動産利回り~ 築年+構造+用途+・・・)とすると、構造の欄は、SRC,RC,S,木造のどれかが勝手に削除され(基準値として0にされ?)、残った3つの係数が表示されると思います。
その際に、どれを残すかを自分で選択できないかという質問です。
単純に'構造'をfactorにする(4種類の値を取りうる)にすればいいのでは?
確かにおっしゃる通りですね。そのように対応します。
なんとなく、基準にするFactorを自分で選択できないか、疑問に思ったので質問を載せてみました。
回答1件
あなたの回答
tips
プレビュー