環境:Ubuntu 18.04
フレームワーク:pytorch
困っていること:
①作成したモデルのロードができない
②Grad-CAMを実装しようとすると以下のエラーが出る
初心者ながら頑張って、現在pytorchを使ってresnet18の転移学習を行っています。
実際に学習には成功し、推論、Grad-CAMの実装を試みています。
上記の2点で躓いています。ご教授いただけたら幸いです。
①
様々なサイトに乗っている以下のコードを実行
python
1torch.save(the_model, PATH)
python
1the_model = torch.load(PATH)
上記のような保存、ロードは問題なくできました。
ですが、下記で保存したモデルをうまくロードできません。
python
1torch.save(the_model.state_dict(), PATH)
さまざまなサイトで下記が記載してありますが、name 'TheModelClass' is not defined
とエラーが出ます。
python
1the_model = TheModelClass(*args, **kwargs) 2the_model.load_state_dict(torch.load(PATH))
*args、*kwargsについても調べて理解はしたつもりですが、TheModelClassをどう定義するのか?などわかりません。
ご教授お願いします。
②Grad-CAMについて
サイトに掲載されたソースコードを転用して、自分の作成したモデルで試そうとするのですが、
Input type (torch.FloatTensor) and weight type (torch.cuda.FloatTensor) should be the sameというエラーが出ます。
python
1import torch 2import torch.nn as nn 3import torch.nn.functional as F 4from torch import optim 5import pandas as pd 6import numpy as np 7import matplotlib.pyplot as plt 8from torchvision import datasets, transforms 9from torchvision import models 10from tqdm import tqdm_notebook as tqdm 11from PIL import Image 12import cv2 13 14 15device = torch.device("cuda" if torch.cuda.is_available() else "cpu") 16 17class GradCAM: 18 def __init__(self, model, feature_layer): 19 self.model = model 20 self.feature_layer = feature_layer 21 self.model.eval() 22 self.feature_grad = None 23 self.feature_map = None 24 self.hooks = [] 25 26 # 最終層逆伝播時の勾配を記録する 27 def save_feature_grad(module, in_grad, out_grad): 28 self.feature_grad = out_grad[0] 29 self.hooks.append(self.feature_layer.register_backward_hook(save_feature_grad)) 30 31 # 最終層の出力 Feature Map を記録する 32 def save_feature_map(module, inp, outp): 33 self.feature_map = outp[0] 34 self.hooks.append(self.feature_layer.register_forward_hook(save_feature_map)) 35 36 def forward(self, x): 37 return self.model(x) 38 39 def backward_on_target(self, output, target): 40 self.model.zero_grad() 41 one_hot_output = torch.zeros([1, output.size()[-1]]) 42 one_hot_output[0][target] = 1 43 output.backward(gradient=one_hot_output, retain_graph=True) 44 45 def clear_hook(self): 46 for hook in self.hooks: 47 hook.remove() 48 49model.full=torch.load("PATH") 50 51model.load_state_dict(torch.load(model_path)) 52image_model.eval() 53id_to_label = { 54 0: 'other', 55 1: 'true' 56} 57 58grad_cam = GradCAM(model=image_model, feature_layer=list(image_model.layer4.modules())[-1]) 59 60 61from PIL import Image 62from torchvision.transforms.functional import to_pil_image 63 64VISUALIZE_SIZE = (224, 224) 65normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]) 66 67image_transform = transforms.Compose([ 68 transforms.Resize(256), 69 transforms.CenterCrop(224), 70 transforms.ToTensor(), 71 transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) 72 ]) 73 74path = "PATH2" 75image = Image.open(path) 76image.thumbnail(VISUALIZE_SIZE, Image.ANTIALIAS) 77display(image) 78 79# save image origin size 80image_orig_size = image.size # (W, H) 81 82img_tensor = image_transform(image) 83img_tensor = img_tensor.unsqueeze(0) 84 85model_output = grad_cam.forward(img_tensor) 86target = model_output.argmax(1).item()
上記実行した際ののエラー
python
1Input type (torch.FloatTensor) and weight type (torch.cuda.FloatTensor) should be the same
よろしくお願いします。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/22 15:17