質問編集履歴

2

説明変数を前日に

2020/08/25 23:33

投稿

tsugumi_7788
tsugumi_7788

スコア31

test CHANGED
File without changes
test CHANGED
@@ -171,3 +171,23 @@
171
171
  名前が違うのはこの後、上のリストをX_train = np.array(x_train2)みたいに配列に変えているためです。
172
172
 
173
173
  うーん…どうでしょうか?
174
+
175
+
176
+
177
+
178
+
179
+
180
+
181
+ 説明変数を前日のデータに変えてみました。
182
+
183
+ Training set score: 0.9423408520732327
184
+
185
+ Test set score: 0.9417546025663195
186
+
187
+
188
+
189
+ 係数 [ 0.08076883 0.33253482 0.62133499 0.01178906 0.08027002 -0.13845382]
190
+
191
+
192
+
193
+ なんだか少しまともになった気がします。おっしゃる通り当日のデータをインプットして当日の気温をアウトプットしていたのは予測になっていないことがわかりました。ありがとうございました。

1

情報を追加しました。

2020/08/25 23:33

投稿

tsugumi_7788
tsugumi_7788

スコア31

test CHANGED
File without changes
test CHANGED
@@ -39,3 +39,135 @@
39
39
 
40
40
 
41
41
  予測 日平均気温
42
+
43
+
44
+
45
+
46
+
47
+
48
+
49
+
50
+
51
+ ```python
52
+
53
+ print(X_train)
54
+
55
+ print(X_test)
56
+
57
+ print(y_train)
58
+
59
+ print(y_test)
60
+
61
+ ```
62
+
63
+ X_train
64
+
65
+ --------
66
+
67
+ [[ 8.0000e-01 1.6000e+00 -5.7000e+00 7.0000e+01 1.0160e+03 8.0000e+00]
68
+
69
+ [ 2.6000e+00 3.3000e+00 -2.9000e+00 6.4000e+01 1.0116e+03 8.0000e+00]
70
+
71
+ [ 6.0000e-01 8.0000e-01 -3.7000e+00 8.4000e+01 1.0112e+03 8.0000e+00]
72
+
73
+ ...
74
+
75
+ [ 3.0000e+00 -1.0000e+00 -5.1000e+00 6.3000e+01 1.0036e+03 8.0000e+00]
76
+
77
+ [ 5.0000e-01 8.0000e-01 -4.5000e+00 7.6000e+01 1.0132e+03 8.0000e+00]
78
+
79
+ [ 1.0000e-01 5.0000e-01 -3.6000e+00 8.5000e+01 1.0204e+03 8.0000e+00]]
80
+
81
+
82
+
83
+ X_test
84
+
85
+ --------
86
+
87
+ [[ 1.3000e+00 -5.0000e-01 -3.1000e+00 7.3000e+01 1.0138e+03 8.0000e+00]
88
+
89
+ [ 4.9000e+00 -6.0000e-01 -7.0000e+00 6.8000e+01 1.0139e+03 8.0000e+00]
90
+
91
+ [ 4.0000e-01 -8.0000e-01 -8.1000e+00 6.6000e+01 1.0180e+03 8.0000e+00]
92
+
93
+ ...
94
+
95
+ [ 1.6000e+00 7.4000e+00 -5.8000e+00 7.6000e+01 1.0165e+03 8.0000e+00]
96
+
97
+ [ 3.8000e+00 8.1000e+00 -7.1000e+00 7.3000e+01 1.0030e+03 8.0000e+00]
98
+
99
+ [ 2.0000e-01 -4.1000e+00 -7.3000e+00 7.6000e+01 1.0093e+03 8.0000e+00]]
100
+
101
+
102
+
103
+
104
+
105
+ y_train
106
+
107
+ --------
108
+
109
+ [-2. 0.1 -1.2 -2.5 -4.1 -4.3 -1.2 -2.7 -1.2 -4.2 -8.5 -8.6 -8.1 -7.7
110
+
111
+ -5.5 -0.1 -3. -2.4 -2.6 -4. -4.9 -5.6 -5. -9.1 -5.5 -2.4 0.7 -4.3
112
+
113
+ -2.7 -3.2 -5. -4.1 -7.7 -4.6 -0.1 -0.4 -0.8 -3.1 -1.2 -0.9 -1.5 -1.7
114
+
115
+ ...
116
+
117
+ 3.5 6.8 10.1 2.2 -0.9 -3.2 -5.9 -5.8 -5.5 -3.9 -3.1 -3.6 -2.6 -1.4
118
+
119
+ 2.7 1.6 -0.8 -1.2 -1.8 0.7 1.6 1.8 -2.8 -1.3 -1.9 -7.2 -4.7 -3.5
120
+
121
+ -0.9 -1.2]
122
+
123
+
124
+
125
+
126
+
127
+ y_test
128
+
129
+ --------
130
+
131
+ [ -1.9 -4.1 -3.3 -0.2 -2.2 -3. -4.8 -3.5 -2. 0.5 -3.6 -2.4
132
+
133
+ -5.1 -5. 0.1 -3. -7.9 -5. -1.8 -2.4 -5.2 -4.3 -2.3 -1.9
134
+
135
+ -1.6 -2.8 -4.3 -0.6 -1.5 -2.1 -4.4 -7. -5. 0.1 -1.7 -4.7
136
+
137
+ ...
138
+
139
+ -1.2 -5.1 -3.6 -3.6 -1. -4.6 -1.8 6.3 6.8 2.7 0.1 1.4
140
+
141
+ -1.6 0.9 5.4 1.5 -1.9 -3.3 -1.3 -2.1 -3.7 -5. -3.4 -2.9
142
+
143
+ -2.7 -4.7 -2.9 1.5 -1.1 -5.8]
144
+
145
+
146
+
147
+
148
+
149
+ 皆さんのおっしゃる通りデータに不備がありそうですね…。学習データとテストデータを上に示しました。
150
+
151
+
152
+
153
+
154
+
155
+
156
+
157
+ 元データは以下のように分けました。
158
+
159
+ ```python
160
+
161
+ x_train2 = x_data[0:730]
162
+
163
+ x_test2 = x_data[730:1096]
164
+
165
+ y_train2 = y_data[0:730]
166
+
167
+ y_test2 = y_data[730:1096]
168
+
169
+ ```
170
+
171
+ 名前が違うのはこの後、上のリストをX_train = np.array(x_train2)みたいに配列に変えているためです。
172
+
173
+ うーん…どうでしょうか?