質問編集履歴

2

コードの修正

2020/08/22 08:51

投稿

SuzuAya
SuzuAya

スコア71

test CHANGED
File without changes
test CHANGED
@@ -46,6 +46,20 @@
46
46
 
47
47
 
48
48
 
49
+ # データを特徴量と目的変数に分ける
50
+
51
+ df_x = df
52
+
53
+ df_y = df[['感染者数']]
54
+
55
+
56
+
57
+ #print(df_x.head())
58
+
59
+ #print(df_y.head())
60
+
61
+
62
+
49
63
  # xgboostモデルの作成
50
64
 
51
65
  reg = xgb.XGBRegressor()

1

使用するデータの詳細を追記いたしました.

2020/08/22 08:51

投稿

SuzuAya
SuzuAya

スコア71

test CHANGED
File without changes
test CHANGED
@@ -5,6 +5,14 @@
5
5
  2020/1/20~2020/6/30までのデータを,「過去20日分のデータを入力し,将来20日分のデータを出力する」ような形で読み込むにはどうしたらいいかアドバイスをいただけますと幸いです.
6
6
 
7
7
  (例:2020/1/20~2020/2/8までのデータを入力し,2020/2/9~2020/2/28までのデータを出力する)
8
+
9
+
10
+
11
+ データの詳細:2020/1/20~2020/6/30までの韓国における新型コロナ感染者のデータです.
12
+
13
+ 感染日,性別,年齢,居住地などの情報が含まれています.
14
+
15
+ これらの情報をXGBOOSTの回帰モデルに入力し,予測感染者数を出力させたいと考えております.
8
16
 
9
17
 
10
18
 
@@ -29,6 +37,12 @@
29
37
  import matplotlib.pyplot as plt
30
38
 
31
39
  from sklearn.externals import joblib
40
+
41
+
42
+
43
+ df = pd.read_csv("data.csv")
44
+
45
+ #print(df.head)
32
46
 
33
47
 
34
48