質問編集履歴
2
コードの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -46,6 +46,20 @@
|
|
46
46
|
|
47
47
|
|
48
48
|
|
49
|
+
# データを特徴量と目的変数に分ける
|
50
|
+
|
51
|
+
df_x = df
|
52
|
+
|
53
|
+
df_y = df[['感染者数']]
|
54
|
+
|
55
|
+
|
56
|
+
|
57
|
+
#print(df_x.head())
|
58
|
+
|
59
|
+
#print(df_y.head())
|
60
|
+
|
61
|
+
|
62
|
+
|
49
63
|
# xgboostモデルの作成
|
50
64
|
|
51
65
|
reg = xgb.XGBRegressor()
|
1
使用するデータの詳細を追記いたしました.
test
CHANGED
File without changes
|
test
CHANGED
@@ -5,6 +5,14 @@
|
|
5
5
|
2020/1/20~2020/6/30までのデータを,「過去20日分のデータを入力し,将来20日分のデータを出力する」ような形で読み込むにはどうしたらいいかアドバイスをいただけますと幸いです.
|
6
6
|
|
7
7
|
(例:2020/1/20~2020/2/8までのデータを入力し,2020/2/9~2020/2/28までのデータを出力する)
|
8
|
+
|
9
|
+
|
10
|
+
|
11
|
+
データの詳細:2020/1/20~2020/6/30までの韓国における新型コロナ感染者のデータです.
|
12
|
+
|
13
|
+
感染日,性別,年齢,居住地などの情報が含まれています.
|
14
|
+
|
15
|
+
これらの情報をXGBOOSTの回帰モデルに入力し,予測感染者数を出力させたいと考えております.
|
8
16
|
|
9
17
|
|
10
18
|
|
@@ -29,6 +37,12 @@
|
|
29
37
|
import matplotlib.pyplot as plt
|
30
38
|
|
31
39
|
from sklearn.externals import joblib
|
40
|
+
|
41
|
+
|
42
|
+
|
43
|
+
df = pd.read_csv("data.csv")
|
44
|
+
|
45
|
+
#print(df.head)
|
32
46
|
|
33
47
|
|
34
48
|
|