編集履歴

質問編集履歴

ソースコード部分が分かりにくかったため修正

2022/12/08 02:00

投稿

aiue_minami

スコア1

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,4 +1,4 @@
-### 前提
+_イタリックテキスト_### 前提
 LSTMの勉強のため、pythonでLSTMを用いて株価の予測を行うシステムを作成しています。
 100日分のデータの内,80日分を学習データとして20日分の予測を行うシステムは完成しました。
 様々なLSTMの実装を参考にしましたが、「どれも一つの時系列データの前半部分を学習に使って、後半部分を予測する」というのが趣旨でした。
@@ -35,7 +35,7 @@
 %matplotlib inline
 device=torch.device('cpu')
-#基本情報--------------------------------------------------
+#基本情報
 seq_length = 30# 1データの予測に用いる過去フレームは40とする
 test_data_size = 20# 直近20frameをテストデータにする
 pred_frames = 20# 予測するフレーム
@@ -57,11 +57,11 @@
 data_length=data.shape[0]
 data.shape
-#学習データとテストデータ----------------------------------------------------
+#学習データとテストデータ
 train_data = data[:-test_data_size]
 test_data = data[-test_data_size:]
-#学習データとテストデータを最小値0と最大値1の範囲で正規化してTensor型にする----
+#学習データとテストデータを最小値0と最大値1の範囲で正規化してTensor型にする
 from sklearn.preprocessing import MinMaxScaler
 scaler = MinMaxScaler(feature_range=(0, 1))
 train_data_normalized = scaler.fit_transform(train_data)
@@ -70,7 +70,7 @@
 test_data_normalized = scaler.fit_transform(test_data)
 test_data_normalized = torch.FloatTensor(test_data_normalized)
-#シーケンスに沿ったデータを作成する関数------------------------------------------
+#シーケンスに沿ったデータを作成する関数
 def make_sequence_data(input_data, sequence_length):
     data_length = len(input_data)    # 全体のデータ数取得
     seq_data=[]#説明変数が入った時系列データを入れるリスト
@@ -79,9 +79,7 @@
     for i in range(data_length - sequence_length):
         # 1個ずらして、シーケンス分のデータを取得していく
         seq = input_data[i:i+sequence_length]
-        target = input_data[:,128][i+sequence_length:i+sequence_length+1]# シーケンスの次の要素のデータ(ラベルデータとして1個目の陽性者数のみ)を取得していく
+        target = input_data[:,128][i+sequence_length:i+sequence_length+1]
         seq_data.append(seq)
         target_data.append(target)
     return seq_data, target_data
@@ -89,7 +87,7 @@
 seq,labels = make_sequence_data(train_data_normalized, seq_length)
-#LSTMmodelを作成してインスタンス生成&損失関数と最適化関数を定義-----------
+#LSTMmodelを作成してインスタンス生成&損失関数と最適化関数を定義
 class LSTM(nn.Module):
     def __init__(self, input_size=129, hidden_layer_size=100, output_size=1):
         super().__init__()
@@ -103,18 +101,17 @@
         # hidden stateとcell stateにはNoneを渡して0ベクトルを渡す
         lstm_out, (hn, cn) = self.lstm(x, None)
         # Linearのinputは(N,∗,in_features)にする
-        # lstm_out(batch_size, seq_len, hidden_layer_size)のseq_len方向の最後の値をLinearに入力する
         prediction = self.linear(lstm_out[:, -1, :])
         #[:,-1,:]で各バッチの最終時刻の特徴量の行が取れる
         return prediction
 model = LSTM()
 model.to(device)
-# 損失関数と最適化関数を定義----------------------------------
+#損失関数と最適化関数を定義
 criterion = nn.MSELoss()
 optimizer = optim.Adam(model.parameters(), lr=0.001)
-#バッチを作成する関数-------------------------------------------------
+#バッチを作成する関数
 losses = []
 training_size=data.shape[0]-seq_length-test_data_size#学習データの数
 def mkRandomBatch(train_x,train_y, batch_size,training_size,seq_length):
@@ -138,7 +135,7 @@
 batch_seq, batch_labels = mkRandomBatch(seq,labels,batch_size,training_size,seq_length)
-#エポックを回して学習させてる--------------------------------------------------
+#エポックを回して学習させてる
 for epoch in range(epochs_num):
     for i in range(int(training_size / batch_size)):
         optimizer.zero_grad()#勾配初期化
@@ -150,10 +147,9 @@
         losses.append(single_loss.item())
     print(f'epoch: {i}, loss : {single_loss.item()}')
-# 予測するためのデータの最初のseq_length分はtrain_dataを使う
 test_inputs = train_data_normalized[-seq_length:].tolist()
-#予測するフェーズ------------------------------------------------------------------
+#予測するフェーズ
 model.eval()# モデルを評価モードとする
 test_outputs = []# 予測値を入れるリスト
 for i in range(pred_frames):
@@ -164,8 +160,8 @@
         test_inputs.append(test_data_normalized.tolist()[i])#test_inputにどんどん追加
         test_outputs.append(model(seq).item())
-#予測結果の整形-------------------------------------------------
+#予測結果の整形
-# 列方向に同じ値を追加して(20, 129)にする
+#列方向に同じ値を追加して(20, 129)にする
 np_test_outputs = np.array(test_outputs).reshape(-1,1)
 np_test_outputs2 = np.hstack((np_test_outputs, np_test_outputs))
 np_test_outputs3 = np.hstack((np_test_outputs2, np_test_outputs))

深層学習 PyTorch Python