質問編集履歴
2
コードの修正
title
CHANGED
File without changes
|
body
CHANGED
@@ -22,6 +22,13 @@
|
|
22
22
|
df = pd.read_csv("data.csv")
|
23
23
|
#print(df.head)
|
24
24
|
|
25
|
+
# データを特徴量と目的変数に分ける
|
26
|
+
df_x = df
|
27
|
+
df_y = df[['感染者数']]
|
28
|
+
|
29
|
+
#print(df_x.head())
|
30
|
+
#print(df_y.head())
|
31
|
+
|
25
32
|
# xgboostモデルの作成
|
26
33
|
reg = xgb.XGBRegressor()
|
27
34
|
|
1
使用するデータの詳細を追記いたしました.
title
CHANGED
File without changes
|
body
CHANGED
@@ -3,6 +3,10 @@
|
|
3
3
|
2020/1/20~2020/6/30までのデータを,「過去20日分のデータを入力し,将来20日分のデータを出力する」ような形で読み込むにはどうしたらいいかアドバイスをいただけますと幸いです.
|
4
4
|
(例:2020/1/20~2020/2/8までのデータを入力し,2020/2/9~2020/2/28までのデータを出力する)
|
5
5
|
|
6
|
+
データの詳細:2020/1/20~2020/6/30までの韓国における新型コロナ感染者のデータです.
|
7
|
+
感染日,性別,年齢,居住地などの情報が含まれています.
|
8
|
+
これらの情報をXGBOOSTの回帰モデルに入力し,予測感染者数を出力させたいと考えております.
|
9
|
+
|
6
10
|
### 該当のソースコード
|
7
11
|
データの前処理部分は割愛させていただきます.
|
8
12
|
|
@@ -15,6 +19,9 @@
|
|
15
19
|
import matplotlib.pyplot as plt
|
16
20
|
from sklearn.externals import joblib
|
17
21
|
|
22
|
+
df = pd.read_csv("data.csv")
|
23
|
+
#print(df.head)
|
24
|
+
|
18
25
|
# xgboostモデルの作成
|
19
26
|
reg = xgb.XGBRegressor()
|
20
27
|
|