teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

コードの修正

2020/08/22 08:51

投稿

SuzuAya
SuzuAya

スコア71

title CHANGED
File without changes
body CHANGED
@@ -22,6 +22,13 @@
22
22
  df = pd.read_csv("data.csv")
23
23
  #print(df.head)
24
24
 
25
+ # データを特徴量と目的変数に分ける
26
+ df_x = df
27
+ df_y = df[['感染者数']]
28
+
29
+ #print(df_x.head())
30
+ #print(df_y.head())
31
+
25
32
  # xgboostモデルの作成
26
33
  reg = xgb.XGBRegressor()
27
34
 

1

使用するデータの詳細を追記いたしました.

2020/08/22 08:51

投稿

SuzuAya
SuzuAya

スコア71

title CHANGED
File without changes
body CHANGED
@@ -3,6 +3,10 @@
3
3
  2020/1/20~2020/6/30までのデータを,「過去20日分のデータを入力し,将来20日分のデータを出力する」ような形で読み込むにはどうしたらいいかアドバイスをいただけますと幸いです.
4
4
  (例:2020/1/20~2020/2/8までのデータを入力し,2020/2/9~2020/2/28までのデータを出力する)
5
5
 
6
+ データの詳細:2020/1/20~2020/6/30までの韓国における新型コロナ感染者のデータです.
7
+ 感染日,性別,年齢,居住地などの情報が含まれています.
8
+ これらの情報をXGBOOSTの回帰モデルに入力し,予測感染者数を出力させたいと考えております.
9
+
6
10
  ### 該当のソースコード
7
11
  データの前処理部分は割愛させていただきます.
8
12
 
@@ -15,6 +19,9 @@
15
19
  import matplotlib.pyplot as plt
16
20
  from sklearn.externals import joblib
17
21
 
22
+ df = pd.read_csv("data.csv")
23
+ #print(df.head)
24
+
18
25
  # xgboostモデルの作成
19
26
  reg = xgb.XGBRegressor()
20
27