質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.36%

【MNIST】PyTorchのsize mismatchエラー

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 436

score 15

こちらのサイトを元に以下の構成のネットワークをPyTorchで実装しようと思ったのですが、
size mismatch, m1: [128 x 256], m2: [128 x 256]axというエラーが出てきてしまいました。

当方まだ初学者で、ディープラーニングのお作法やPyTorchの記述方法があまりわかっていないので解決方法を教えていただきたいです。


実装したいネットワーク構成

conv - relu - conv- relu - pool -
conv - relu - conv- relu - pool -
conv - relu - conv- relu - pool -
affine - relu - dropout - affine - dropout - softmax


ソースコード(ネットワーク部分)

class CNNModel (nn.Module):
    def __init__(self):
        super(CNNModel, self).__init__()

        self.conv1=nn.Conv2d(1,16,3,1)
        self.conv2=nn.Conv2d(16,16,3,1)

        self.conv3=nn.Conv2d(16,32,3,1)
        self.conv4=nn.Conv2d(32,32,3,1)

        self.conv5=nn.Conv2d(32,64,3,1)
        self.conv6=nn.Conv2d(64,64,3,1)

        self.pool=nn.MaxPool2d(2,2)

        self.dropout1=nn.Dropout2d(0.25)
        self.dropout2=nn.Dropout2d(0.5)

        self.fc1=nn.Linear(128,256) # ,256
        self.fc2=nn.Linear(256,10)

    def forward(self, x):
        x=self.conv1(x)
        x=F.relu(x)
        x=self.conv2(x)
        x=F.relu(x)
        x=self.pool(x)

        x=self.conv3(x)
        x=F.relu(x)
        x=self.conv4(x)
        x=F.relu(x)

        x=self.conv5(x)
        x=F.relu(x)
        x=self.conv6(x)
        x=F.relu(x)


        x=self.pool(x)
        x=self.dropout1(x)

        x=x.view(-1,self.num_flat_features(x)) # 128*256

        print(x.size()[0])

        x=self.fc1(x)
        x=F.relu(x)
        x=self.dropout2(x)
        x=self.fc2(x)
        x=F.log_softmax(x,dim=1)

        return x

エラー詳細

---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
<ipython-input-5-7a8a290ae702> in <module>
    144         optimizer.zero_grad()
    145 
--> 146         output = cnn.forward(x) # WRITE ME (予測の計算)
    147         loss = loss_fn(output,t) # WRITE ME (損失関数の計算)
    148         loss.backward() # WRITE ME (勾配の計算)

<ipython-input-5-7a8a290ae702> in forward(self, x)
     97         print(x.size()[0])
     98 
---> 99         x=self.fc1(x)
    100         x=F.relu(x)
    101         x=self.dropout2(x)

/usr/local/lib/python3.7/dist-packages/torch/nn/modules/module.py in __call__(self, *input, **kwargs)
    548             result = self._slow_forward(*input, **kwargs)
    549         else:
--> 550             result = self.forward(*input, **kwargs)
    551         for hook in self._forward_hooks.values():
    552             hook_result = hook(self, input, result)

/usr/local/lib/python3.7/dist-packages/torch/nn/modules/linear.py in forward(self, input)
     85 
     86     def forward(self, input):
---> 87         return F.linear(input, self.weight, self.bias)
     88 
     89     def extra_repr(self):

/usr/local/lib/python3.7/dist-packages/torch/nn/functional.py in linear(input, weight, bias)
   1608     if input.dim() == 2 and bias is not None:
   1609         # fused op is marginally faster
-> 1610         ret = torch.addmm(bias, input, weight.t())
   1611     else:
   1612         output = input.matmul(weight.t())

RuntimeError: size mismatch, m1: [128 x 256], m2: [128 x 256] at /pytorch/aten/src/THC/generic/THCTensorMathBlas.cu:283
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

m1: [128 x 256] の2番目の「256」と、
m2: [128 x 256] の1番目の「128」が違うというエラーです

m2の形状は、self.fc1=nn.Linear(128,256) の定義より

m1はfc1の入力なので、x=x.view(-1,self.num_flat_features(x)) の結果の形状

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.36%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る