質問編集履歴

係数からグラフを作成する方法の追加

2021/04/21 09:09

投稿

unser

スコア58

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -70,6 +70,14 @@
 model4.fit(x_20,y)
 # visualize model
+# visualize model
+def model_conf(model,x):
+  y=[model.intercept_ for _ in range(len(x))]
+  for j in range(len(x)):
+    for i in range(len(model.coef_)):
+      y[j]+=model.coef_[i]*((x[j][0])**(i+1))
+  return y
 plt.figure(figsize=(10, 7))
 X_plt=np.arange(0,2,0.01).reshape(200,1)
@@ -85,6 +93,7 @@
 plt.plot(X_plt, func(X_plt), color='purple', linestyle='-', label='True Function', lw=5)
 plt.plot(X_plt, y_pred, color='red', linestyle=':', label='LinearRegression', lw=3)
 plt.plot(X_plt, y_pred2, color='black', linestyle='--', label='Line Ridge(α={})'.format(k_1), lw=3)
+#plt.plot(X_plt, model_conf(model3,X_plt), color='purple', linestyle="dashdot", label='Polynomial regression(20)', lw=5)
 plt.plot(X_plt, y_pred3, color='green', linestyle="dashdot", label='Polynomial regression(20)', lw=3)
 plt.plot(X_plt, y_pred4, color='pink', linestyle='-', label='Poly Ridge(α={})'.format(k_1), lw=3)
 plt.legend()

ridge項の追加方法

2021/04/21 09:09

投稿

unser

スコア58

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,7 +1,5 @@
 Pythonにて,Ridge回帰などを行い,その損失関数(MSE)の値を算出したいのですが,
-その見方の方法がわからないためご教授していただけると幸いです
+その見方の方法がわからないためご教授していただけると幸いです.
-(実装は直に損失関数を計算しましたが,Ridgeに関しては方法がわからなかったため,
- ひとまず,ridgeの項をゼロとしました).
 また,Ridge回帰や線形単回帰,他項回帰で得られた,モデルの係数を
 どのように参照したら良いかを教えていただけると幸いです.
@@ -97,20 +95,22 @@
 ![イメージ説明](5120432895e976a672b23ee4db9aa60d.png)
 ```python
-#損失関数(仮)を算出する.
+#損失関数を算出する.(修正 4/21, 17:29)
 ans_lst=[]
 for i in range(5):
+  ans=0
   if i==0:
     #score=cross_val_score(model1,x,y,cv=10)
     ans=statistics.mean(list(map(lambda t: t**2, (y-model1.predict(x)).tolist())))
   elif i==1:
-    # 本当はRidgeの項を入れたいが係数がわからない...
+    model2.coef_
     ans=statistics.mean(list(map(lambda t: t**2, (y-model2.predict(x)).tolist())))
+    ans+=sum(list(map(lambda t: t**2, model2.coef_)))
   elif i==2:
     ans=statistics.mean(list(map(lambda t: t**2, (y-model3.predict(x_20)).tolist())))
   elif i==3:
-    # 本当はRidgeの項を入れたいが係数がわからない...
     ans=statistics.mean(list(map(lambda t: t**2, (y-model4.predict(x_20)).tolist())))
+    ans+=sum(list(map(lambda t: t**2, model4.coef_)))
   else:
     #試しに真の分布のもののエラー関数を見てみる.
     ans=statistics.mean(list(map(lambda t: t**2, (y-func(x).reshape(1,-1)[0]).tolist())))
@@ -119,13 +119,19 @@
   ans_lst.append(ans)
 """
-ans_lst=[878.1943851888309,
+[878.1943851888309,
- 6829.205481962394,
+ 6835.932288142904,
  165.22430413762072,
- 1472.468473432889,
+ 1480.3156315725134,
  660.6537337438299]
 """
 ```
+~~ans_lst=[878.1943851888309,
+ 6829.205481962394,
+ 165.22430413762072,
+ 1472.468473432889,
+ 660.6537337438299]~~ <- ridge項を入れる前.
 こちら,最後をみると明らかに過学習しているmodel3が
 最も損失関数が低いため良いモデルとなってしまいました.