質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.34%

pytorch 画像サイズとモデルのマッチ

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 3,668

score 42

pytorchでニューラルネットワークの学習をしたいと思っていますが、transforms.Resizeで画像のサイズを変更した後、モデルに投入するとランタイムエラーが出ます。

RuntimeError: mat1 dim 1 must match mat2 dim 0

resizeで画像サイズを28にすると動くので、画像のサイズとモデルが合っていないと思っていますが、モデルのどこと画像のサイズが関係しているのか理解できていません。

もしわかる方がいらっしゃいましたらご教示ください。

dataset = torchvision.datasets.ImageFolder(root="./tmp", transform = transforms.Compose([transforms.Resize(160), transforms.ToTensor()]))
torch.Size([8, 3, 160, 160])
# ディープラーニングモデル
import torch.nn as nn
import torch.nn.functional as F

OVER_CLUSTRING_Rate = 10  # 多めに分類するoverclsuteringも用意する


class NetIIC(nn.Module):
    def __init__(self):
        super(NetIIC, self).__init__()

        self.conv1 = nn.Conv2d(3, 128, 5, 2, bias=False)
        self.bn1 = nn.BatchNorm2d(128)
        self.conv2 = nn.Conv2d(128, 128, 5, 1, bias=False)
        self.bn2 = nn.BatchNorm2d(128)
        self.conv3 = nn.Conv2d(128, 128, 5, 1, bias=False)
        self.bn3 = nn.BatchNorm2d(128)
        self.conv4 = nn.Conv2d(128, 256, 4, 1, bias=False)
        self.bn4 = nn.BatchNorm2d(256)

        # 0-9に対応すると期待したい10種類のクラス
        self.fc = nn.Linear(256, 10)

        # overclustering
        # 実際の想定よりも多めにクラスタリングさせることで、ネットワークで微細な変化を捉えられるようにする
        self.fc_overclustering = nn.Linear(256, 10*OVER_CLUSTRING_Rate)

    def forward(self, x):
        x = F.relu(self.bn1(self.conv1(x)))
        x = F.relu(self.bn2(self.conv2(x)))
        x = F.relu(self.bn3(self.conv3(x)))
        x = F.relu(self.bn4(self.conv4(x)))
        x_prefinal = x.view(x.size(0), -1)
        y = F.softmax(self.fc(x_prefinal), dim=1)

        y_overclustering = F.softmax(self.fc_overclustering(
            x_prefinal), dim=1)  # overclustering

        return y, y_overclustering
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

画像のサイズが影響するのは、全結合層の入力次元数です。

畳みこんだ後の画像のピクセル数×チャネル数が全結合層の入力次元数にならなければいけません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2021/02/23 08:34

    CNNに入力する画像が160×160×3であっても、conv層を経るごとに画像サイズとチャネル数が変化します。そのため、最終的に全結合層に入る画像サイズは異なるはずです。

    前のコメントに載せたドキュメントにconv層でのサイズの変化の式が載っているので、自分で計算してください。

    キャンセル

  • 2021/02/23 16:32

    ドキュメントを読んでみました。
    ほかにも以下のHPなども参考にしてみました。
    https://deepage.net/deep_learning/2016/11/07/convolutional_neural_network.html
    元の画像のサイズが160で
    conv1 160-5+1=156
    conv2 156-5+1=152
    conv3 152-5+1=148
    conv4 148-4+1=145
    self.fc = nn.Linear(256*145*145, 10)

    mat1 dim 1 must match mat2 dim 0
    これでも同じエラーになります。

    理解が悪くて申し訳ないです。
    少しアドバイスを頂ければと思います。

    キャンセル

  • 2021/02/23 16:41

    strideを忘れていました。うまく動きました!
    ありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.34%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る