質問編集履歴

errorとコードを編集しました。

2020/09/03 01:46

投稿

oinari03

スコア59

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -16,13 +16,28 @@
 ### エラー文
 以下はtrain.pyを実行したら起きたものです。
 ```
-RuntimeError: size mismatch, m1: [32 x 9216], m2: [2304 x 120] at /pytorch/aten/src/TH/generic/THTensorMath.cpp:41
+RuntimeError: Expected 4-dimensional input for 4-dimensional weight [16, 3, 3, 3], but got 2-dimensional input of size [32, 196608] instead
 ```
 ### コード
 train.py（実行したコード）です。まだ完成されていませんが、lossやaccの精度なんかを見ようとしてます。
 ```python
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+import torch.optim as optim
+import model,dataset
+from model import *
+from tqdm import tqdm
+from torch.autograd import Variable
+#一つの機能を作ったら→pritで確認
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
@@ -60,8 +75,12 @@
         shuffle= True
     )
+    # batch = len(next(iter(train_loader))) #2
+    # for i in train_loader:
+    #     print(i)
+    # for i in valid_loader:
+    #     print(i)
     # iterationの確定
     sample_size = len(train_dataset) #129
     num_iters = sample_size // 32 #129 / 32 = 4.03
@@ -70,43 +89,71 @@
     criterion = nn.CrossEntropyLoss()
     #start epoch
-    # 正解率を保持
+    #2エポック
-    for epoch_id in range(2):
+    num_epochs = 2
+    #最後にlossとaccuracyのグラフをプロットするためのリスト
-        # データすべてのトータルロス
+    train_loss_list = []
-        running_loss = 0.0
+    train_acc_list = []
+    val_loss_list = []
+    val_acc_list = []
+    for epoch in range(num_epochs):
+        #エポックごとに初期化
+        train_loss = 0
+        train_acc = 0
+        val_loss = 0
+        val_acc = 0
+        #train==============================
+        #訓練モードへ切り替え
+        model.train()
+        #ミニバッチで分割して読み込む
-        for i, data in tqdm(enumerate(train_loader)):
+        for i, (images, labels) in enumerate(train_loader):
+            #viewで縦横32ピクセルで3チャンネルの画像を１次元に変換
-            #入力データ・ラベルに分割
+            #toでgpuに転送
-            # get the inputs
-            inputs, labels = data
-            # Variableに変形
-            # wrap them in Variable
-            inputs, labels = Variable(inputs), Variable(labels)
+            images, labels = images.view(images.shape[0], -1).to(device), labels.to(device)
-            # optimizerの初期化
+            #勾配をリセット
-            # zero the parameter gradients
             optimizer.zero_grad()
-            #一連の流れ
+            #順伝播の計算
-            # forward + backward + optimize
-            outputs = model(inputs)
+            outputs = model(images)
-            #ここでラベルデータに対するCross-Entropyがとられる
+            #lossの計算
             loss = criterion(outputs, labels)
+            #lossのミニバッチ分を溜め込む
+            train_loss += loss.item()
+            #accuracyをミニバッチ分を溜め込む
+            #正解ラベル（labels）と予測値のtop1（outputs.max(1)）が合っている場合に1が返ってきます。
+            train_acc += (outputs.max(1)[1] == labels).sum().item()
+            #逆伝播の計算
             loss.backward()
+            #重みの更新
             optimizer.step()
-            # ロスの表示
-            # print statistics
+        #平均lossと平均accuracyを計算
+        avg_train_loss = train_loss / len(train_loader.dataset)
+        avg_train_acc = train_acc / len(train_loader.dataset)
+        #val==============================
+        #評価モードへ切り替え
+        model.eval()
+        #評価するときに必要のない計算が走らないようにtorch.no_gradを使用しています。
+        with torch.no_grad():
+            for images, labels in valid_loader:
+                images, labels = images.view(-1, 32*32*3).to(device), labels.to(device)
+                outputs = model(images)
+                loss = criterion(outputs, labels)
-            running_loss += loss.data[0]
+                val_loss += loss.item()
+                val_acc += (outputs.max(1)[1] == labels).sum().item()
+        avg_val_loss = val_loss / len(valid_loader.dataset)
-            if i % 2000 == 1999:    # print every 2000 mini-batches
+        avg_val_acc = val_acc / len(valid_loader.dataset)
-                print('[%d, %5d] loss: %.3f' %
+        #訓練データのlossと検証データのlossとaccuracyをログで出しています。
+        print ('Epoch [{}/{}], Loss: {loss:.4f}, val_loss: {val_loss:.4f}, val_acc: {val_acc:.4f}'
-                    (epoch_id + 1, i + 1, running_loss / 2000))
+                    .format(epoch+1, num_epochs, i+1, loss=avg_train_loss, val_loss=avg_val_loss, val_acc=avg_val_acc))
-                running_loss = 0.0
+        #最後にグラフをプロットするようにリストに格納
-    print('Finished Training')
+        train_loss_list.append(avg_train_loss)
+        train_acc_list.append(avg_train_acc)
+        val_loss_list.append(avg_val_loss)
+        val_acc_list.append(avg_val_acc)
 ```
 以下はmodelの実装です。おそらく、こちらでミスしていると思うのですが、同編集すればいいのか...

追記しました。

2020/09/03 01:46

投稿

oinari03

スコア59

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -183,6 +183,26 @@
     print(net)
 ```
+model.pyの出力結果を示します。
+ここでは最後のLinearでの数値とあっていないように思えます。
+```ここに言語を入力
+Net(
+  (relu): ReLU()
+  (conv1): Conv2d(3, 16, kernel_size=(3, 3), stride=(1, 1))
+  (pool1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
+  (conv2): Conv2d(16, 32, kernel_size=(3, 3), stride=(1, 1))
+  (pool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
+  (conv3): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1))
+  (pool3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
+  (conv4): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1))
+  (pool4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
+  (conv5): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1))
+  (pool5): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
+  (fc1): Linear(in_features=2304, out_features=120, bias=True)
+  (fc2): Linear(in_features=120, out_features=84, bias=True)
+  (fc3): Linear(in_features=84
+)
+```
 ### まとめ
 以上の情報から画像のサイズのミスマッチが起きているのがわかるのですが、どこをどう編集すればいいのかがわかりません。