学習データ(r2train.csv)とテストデータ(r2test.csv)を使います。
部屋の賃料に関して、データ量を増やした場合の分析をします。
出たグラフを見て考察をしないといけないのですが、グラフの見方がわからないです。
これがそのグラフです⇩
・
・
・
・
・
プログラム
> r2_train <- read.csv(file="r2train.csv") > r2_model <- lm(cost ~ area + walk + floor, data=r2_train) > summary(r2_model) Call: lm(formula = cost ~ area + walk + floor, data = r2_train) Residuals: Min 1Q Median 3Q Max -5.3178 -0.7980 -0.0032 0.7540 5.1886 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 3.181217 0.148465 21.427 < 2e-16 *** area 0.222796 0.002762 80.666 < 2e-16 *** walk -0.076894 0.010661 -7.212 1.09e-12 *** floor 0.130441 0.019478 6.697 3.56e-11 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.314 on 996 degrees of freedom Multiple R-squared: 0.87, Adjusted R-squared: 0.8696 F-statistic: 2223 on 3 and 996 DF, p-value: < 2.2e-16 > p2_train <- predict(r2_model) > residual <- r2_train$cost - p2_train > sd(residual) [1] 1.312138 > summary(residual) Min. 1st Qu. Median Mean 3rd Qu. Max. -5.317757 -0.797980 -0.003197 0.000000 0.753994 5.188593 > r2_test <- read.csv(file="r2test.csv") > p2_test <- predict(r2_model,r2_test) > residual_test <- r2_test$cost - p2_test > sd(residual_test) [1] 1.302336 > summary(residual_test) Min. 1st Qu. Median Mean 3rd Qu. Max. -6.91138 -0.80368 -0.09776 -0.02305 0.69127 9.54481 > pairs(r2_train)
回答1件
あなたの回答
tips
プレビュー