回答編集履歴

詳しく書いた

2021/04/09 05:19

投稿

BoKuToTuZenU

スコア51

answer CHANGED Viewed

@@ -1,11 +1,67 @@
+エラーメッセージは入力が4次元を想定しているのに、3次元の入力が入ってきた
+という意味です。
-pytorchの場合、入力は(Batch_Size, Channel, Height, Width)です。
+pytorchの場合、モデルに入力するテンソルの次元は(Batch_Size, Channel, Height, Width)の4次元です。
 (https://discuss.pytorch.org/t/dimensions-of-an-input-image/19439)
-ですが、入力が(Channel, Height, Width)となっているため、エラーが起きていると考えられます。
+ですが、ご提示いただいているコードでは入力が(Channel, Height, Width)の3次元となっているため、エラーが起きていると考えられます。
+つまり、入力のtensorに新しい次元を足せばよいということになります。
+また、画像の訓練時のサイズとデプロイ時のサイズは必ずしも一致している必要なないかと思います。
+SRGANなどの学習でも,(64x64)のパッチで学習を行います。
+推論時では、元の画像の大きさをそのまま入力するやり方を取っていたはずです。
+そのため、ご提示いただいていたコードであるような、
+```python
+            #画像の読み込みと名前，拡張子の取得
+            os.chdir(input_dir)
+            apply_img = Image.open(n).convert("RGB")
+            img_name, img_ext = os.path.splitext(n)
+            print(img_name)
+            #画像サイズとクロップ数の計算部分
+            numX = apply_img.width // sample_img.width
+            numY = apply_img.height // sample_img.height
+            crop_imgs = []
+            out_imgs = []
+            #画像を分割
+            for i in range(numY):
+                for j in range(numX):
+                    input_img = apply_img.crop((sample_img.width * j, sample_img.height*i,
+                                               sample_img.width * j + sample_img.width, sample_img.height * i + sample_img.height))
+                    input_img_tensor = tv.transforms.ToTensor()(input_img)
+                    crop_imgs.append(input_img_tensor)
+            #分割をモデルに適用
+            for m in crop_imgs:
+                prediction = model(m)
+                out_imgs.append(prediction)
-そのため、入力する前に、
+            #モデルの出力画像を繋げる
+            append_imgs = out_imgs
+            v_img = []
+            for y in range(numY):
+                u_img = []
+                for x in range(numX):
+                    num = x + y * numX
+                    u_img.append(append_imgs[num])
+                imgU = cv2.hconcat(u_img)
+                v_img.append(imgU)
+            append_img = cv2.vconcat(v_img)
+            append_img = Image.fromarray(np.unit8(append_img))
+            save_name = str(n)
+            save_name_dir = os.path.join(save_dir, save_name)
+            append_img.save(save_name_dir)
 ```
-C, W, H = input_img_tensor.size()
+のような部分は
-input_img = input_img_tensor.reshape(1, C, W, H)
 ```
-などとしてみてはいかがでしょうか？
-また、画像の訓練時のサイズとデプロイ時のサイズは必ずしも一致している必要なないかと思います。
+apply_img = Image.open(n).convert("RGB")
+input_image_tensor = tv.transforms.ToTensor()(apply_img)
+input_image_tensor = torch.unsqueeze(input_image_tensor, 0)
+prediction = model(m)
+```
+としても良いアウトプットを得られるかと思います。
 SRGANなどの学習でも,(64x64)のパッチで学習を行い、デプロイ時はパッチを利用しないで推論していたと思います。

ミスを修正しました。

2021/04/09 05:19

投稿

BoKuToTuZenU

スコア51

answer CHANGED Viewed

@@ -3,8 +3,8 @@
 ですが、入力が(Channel, Height, Width)となっているため、エラーが起きていると考えられます。
 そのため、入力する前に、
 ```
-C, W, H = input_img.size()
+C, W, H = input_img_tensor.size()
-input_img = input_img.reshape(1, C, W, H)
+input_img = input_img_tensor.reshape(1, C, W, H)
 ```
 などとしてみてはいかがでしょうか？
 また、画像の訓練時のサイズとデプロイ時のサイズは必ずしも一致している必要なないかと思います。

ミスを修正しました。

2021/04/09 05:08

投稿

BoKuToTuZenU

スコア51

answer CHANGED Viewed

@@ -1,5 +1,6 @@
-pytorchの場合、入力は(Batch_Size, Channel, Width, Height)です。
+pytorchの場合、入力は(Batch_Size, Channel, Height, Width)です。
+(https://discuss.pytorch.org/t/dimensions-of-an-input-image/19439)
-ですが、入力が(Channel, Width, Height)となっているため、エラーが起きていると考えられます。
+ですが、入力が(Channel, Height, Width)となっているため、エラーが起きていると考えられます。
 そのため、入力する前に、
 ```
 C, W, H = input_img.size()