teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

解決しましたので、過程をメモにしました。

2021/05/06 11:53

投稿

haruake
haruake

スコア4

title CHANGED
File without changes
body CHANGED
@@ -4,41 +4,15 @@
4
4
  ・モデルのあてはまりをよくするため、一般化線形モデルにしてみる方法があると記載があったので、ガンマ分布を指定し実際に行い結果まででました。
5
5
  ・しかし、重回帰モデルであれば一般的な式として「y=ax+bx+・・・・+残渣」のような形で表現できましたが、一般化線形モデルのガンマ分布の際の一般的な式がわかりませんでした。
6
6
  ・そこで、式を教えてもらえないでしょうか。よろしくお願いします。
7
- ###
7
+ ###解決
8
- 参考て、以下のglmのサマリを残ておき
8
+ エクセルで行うこはあきらめて、Rで行うことにしました
9
-
9
+ 予測したいモデル式(model)を作成し、その予測式をつかった予測を行いました。
10
+ test.txtに予測したい説明変数の数値を入れます。この際、予測モデルと同じデータフレームとします。
10
- summary(j_ga)
11
+ data<-"test.txt"
11
-
12
- Call:
13
- glm(formula = air ~ ., family = gaussian, data = air[, c(5,
12
+ file<-read.delim(data,header=T,row.names=1,fileEncording="CP932"
14
- 9, 10, 15, 16)])
15
-
16
- Deviance Residuals:
13
+ new_data<-data.frame(file)
17
- Min 1Q Median 3Q Max
18
- -20.920 -6.013 -1.200 5.310 38.997
19
-
20
- Coefficients:
21
- Estimate Std. Error t value Pr(>|t|)
14
+ predict(model,newdata=new_data)
22
- (Intercept) 72.90253 5.42852 13.430 < 2e-16 ***
23
-
24
- test1 0.22225 0.04493 4.946 1.19e-06 ***
25
-
26
- test2 -0.25764 0.05531 -4.658 4.57e-06 ***
15
+ これで予測値が出ます。
27
-
28
- test3 0.12215 0.01807 6.759 6.00e-11 ***
29
-
30
- test4 -0.88880 0.18387 -4.834 2.03e-06 ***
16
+ なお、一般化線形モデルのガンマ分布の場合は
31
-
32
- test5 -0.33321 0.05180 -6.433 4.23e-10 ***
33
-
34
- Signif. codes: 0 ‘* * *’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
35
-
36
- (Dispersion parameter for gaussian family taken to be 95.53574)
37
-
38
- Null deviance: 60534 on 347 degrees of freedom
39
- Residual deviance: 32673 on 342 degrees of freedom
17
+ predict(model,type="response",newdata=new_data)
40
- AIC: 2582.2
18
+ とするとうまくいきました。
41
-
42
- Number of Fisher Scoring iterations: 2
43
-
44
- ###

1

より質問内容を具体的にしました。

2021/05/06 11:53

投稿

haruake
haruake

スコア4

title CHANGED
@@ -1,1 +1,1 @@
1
- Rを用いて作成した一般化線形モデルの予測に数値を入れ予測値を表示る方法
1
+ 一般化線形モデルでガンマ分布際のがわからず困っいま
body CHANGED
@@ -1,16 +1,11 @@
1
1
  ### 前提・実現したいこと
2
2
 
3
- ・商品の売り上げデータから販売個数を予測するため、Rを用いて重回帰分析を行いました。
4
- ・次にデータごとの係数を確認しモデル式を作成しました。
5
- ・そして、誰でも使えるようにモデル式をエクセルに入力し、セルに説明変数のデータを入力すると計算結果が出るようにしました。
6
- ・しかしこの販売個数と説明変数の間には、非線形の関係があり、正規分布ではないということがわかりました。
7
- そのため、glm関数でガン分布指定し、一般化線形モデルで解析行いました。
3
+ 「R統計解析パーフェクトスター」参考に重回帰分析でモデルを作りました。
8
- 係数もわかり、さてモデルエクセルに入力しうとしところ大変複雑な計算式とがわかり、R行うことにしました。
4
+ ・モデルのあてはまりをよくする一般化線形モデルしてみ方法がある記載あったの、ガンマ分布を指定実際に行い結果ででました。
9
- そこRを用い説明変数データを入力し、結果を表示させる方法を教えてもらえでしょうか
5
+ しかし、重回帰モデルあれば一般的な式とし「y=ax+bx+・・・・+残渣」ような形で表現できまたが一般化線形モデルのガンマ分布の際の一般的式がわかりませんでし
10
- 参考としている資料は「R統計解析パーフェクトマスター」です。
6
+ そこで、式を教えもらえないでしょうか。よろしくお願いします。
11
-
12
7
  ###
13
- 以下glmのサマリ結果です。
8
+ 参考として、以下glmのサマリを残しておきます。
14
9
 
15
10
  summary(j_ga)
16
11
 
@@ -46,14 +41,4 @@
46
41
 
47
42
  Number of Fisher Scoring iterations: 2
48
43
 
49
- ###
44
+ ###
50
- このモデル式に
51
- test1:40
52
- test2:50
53
- test3:130
54
- test4:5
55
- test5:30
56
- を入れ、結果(予測値)を計算し表示させたいです。
57
-
58
- 基礎的なことかもしれませんが、ずっと悩んでいます。
59
- よろしくお願いします。