pytorch backward 処理でgpuエラー

Question

### pytorchでのgpu学習処理でエラーをなくしたい今、深層学習の学習においてパラメータの値を三値にするためのソースコードであるTernary-Weights-Networkのsample学習を行っています。githubからダウンロードしてcpu処理はできたのですが、gpuでの学習ができません。 ### 発生している問題・エラーメッセージ ``` Traceback (most recent call last): File "main.py", line 149, in main() File "main.py", line 84, in main train(args,epoch_index,train_loader,model,optimizer,criterion) File "main.py", line 108, in train loss.backward() File "/usr/local/lib/python3.5/dist-packages/torch/tensor.py", line 118, in backward torch.autograd.backward(self, gradient, retain_graph, create_graph) File "/usr/local/lib/python3.5/dist-packages/torch/autograd/__init__.py", line 94, in backward Variable._execution_engine.run_backward( RuntimeError: expected device cuda:0 and dtype Float but got device cpu and dtype Float ``` ### 該当のソースコード main.py ```python3 import torch import torch.nn as nn from torch.autograd import Variable import torch.optim as optim from torchvision import datasets, transforms import argparse import model as M import util as U def ParseArgs(): parser = argparse.ArgumentParser(description='Ternary-Weights-Network Pytorch MNIST Example.') parser.add_argument('--batch-size',type=int,default=100,metavar='N', help='batch size for training(default: 100)') parser.add_argument('--test-batch-size',type=int,default=100,metavar='N', help='batch size for testing(default: 100)') parser.add_argument('--epochs',type=int,default=100,metavar='N', help='number of epoch to train(default: 100)') parser.add_argument('--lr-epochs',type=int,default=20,metavar='N', help='number of epochs to decay learning rate(default: 20)') parser.add_argument('--lr',type=float,default=1e-3,metavar='LR', help='learning rate(default: 1e-3)') parser.add_argument('--momentum',type=float,default=0.9,metavar='M', help='SGD momentum(default: 0.9)') parser.add_argument('--weight-decay','--wd',type=float,default=1e-5,metavar='WD', help='weight decay(default: 1e-5)') parser.add_argument('--no-cuda',action='store_true',default=False, help='disable CUDA training') parser.add_argument('--seed',type=int,default=1,metavar='S', help='random seed(default: 1)') parser.add_argument('--log-interval',type=int,default=100,metavar='N', help='how many batches to wait before logging training status') args = parser.parse_args() args.cuda = not args.no_cuda and torch.cuda.is_available() return args def main(): args = ParseArgs() if args.cuda: torch.cuda.manual_seed(args.seed) kwargs = {'num_workers': 1, 'pin_memory': True} if args.cuda else {} BATCH_SIZE = args.batch_size TEST_BATCH_SIZE = args.test_batch_size learning_rate = args.lr momentum = args.momentum weight_decay = args.weight_decay ################################################################### ## Load Train Dataset ## ################################################################### train_loader = torch.utils.data.DataLoader( datasets.MNIST('./mnist_data', train=True, download=False, transform=transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,)) ])), batch_size=BATCH_SIZE, shuffle=True,**kwargs) ################################################################### ## Load Test Dataset ## ################################################################### test_loader = torch.utils.data.DataLoader( datasets.MNIST('./mnist_data', train=False, download=False, transform=transforms.Compose([ transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,)) ])), batch_size=TEST_BATCH_SIZE, shuffle=True,**kwargs) model = M.LeNet5_T() print("Using cuda is :", args.cuda) if args.cuda: model.cuda() criterion = nn.CrossEntropyLoss() if args.cuda: criterion.cuda() #optimizer = optim.SGD(model.parameters(),lr=learning_rate,momentum=momentum) optimizer = optim.Adam(model.parameters(),lr=learning_rate,weight_decay=weight_decay) best_acc = 0.0 for epoch_index in range(1,args.epochs+1): adjust_learning_rate(learning_rate,optimizer,epoch_index,args.lr_epochs) train(args,epoch_index,train_loader,model,optimizer,criterion) acc = test(args,model,test_loader,criterion) if acc > best_acc: best_acc = acc U.save_model(model,best_acc) def train(args,epoch_index,train_loader,model,optimizer,criterion): model.train() for batch_idx,(data,target) in enumerate(train_loader): if args.cuda: data,target = data.cuda(),target.cuda() model.cuda() data,target = Variable(data),Variable(target) show = False if show: print('data : {}'. format(data)) print('target : {}'. format(target)) import pdb;pdb.set_trace() optimizer.zero_grad() output = model(data) loss = criterion(output,target) loss.backward() optimizer.step() if batch_idx % args.log_interval == 0: print('Train Epoch: {} [{}/{} ({:.0f}%)] Loss: {:.6f}'.format( epoch_index, batch_idx * len(data), len(train_loader.dataset), 100. * batch_idx / len(train_loader), loss.data)) def test(args,model,test_loader,criterion): ~ 省略 ~ def adjust_learning_rate(learning_rate,optimizer,epoch_index,lr_epoch): lr = learning_rate * (0.1 ** (epoch_index // lr_epoch)) for param_group in optimizer.param_groups: param_group['lr'] = lr return lr if __name__ == '__main__': main() ``` model.py ``` #!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Sat Apr 28 13:34:27 2018 @author: bai """ import torch import torch.nn as nn import torch.nn.functional as F i=0 def Ternarize(tensor): output = torch.zeros(tensor.size()) delta = Delta(tensor) alpha = Alpha(tensor,delta) for i in range(tensor.size()[0]): for w in tensor[i].view(1,-1): pos_one = (w > delta[i]).type(torch.FloatTensor) neg_one = -1 * (w < -delta[i]).type(torch.FloatTensor) out = torch.add(pos_one,neg_one).view(tensor.size()[1:]) device_cpu = torch.device('cpu') #alpha[i].to(device_cpu) #import pdb;pdb.set_trace() output[i] = torch.add(output[i],torch.mul(out,alpha[i].to(device_cpu))) return output def Alpha(tensor,delta): Alpha = [] for i in range(tensor.size()[0]): count = 0 abssum = 0 absvalue = tensor[i].view(1,-1).abs() for w in absvalue: truth_value = w > delta[i] #print to see count = truth_value.sum() i+=1 print(i) abssum = torch.matmul(absvalue,truth_value.type(torch.FloatTensor).view(-1,1).cuda()) Alpha.append(abssum/count) alpha = Alpha[0] for i in range(len(Alpha) - 1): alpha = torch.cat((alpha,Alpha[i+1])) return alpha def Delta(tensor): n = tensor[0].nelement() if(len(tensor.size()) == 4): #convolution layer delta = 0.7 * tensor.norm(1,3).sum(2).sum(1).div(n) elif(len(tensor.size()) == 2): #fc layer delta = 0.7 * tensor.norm(1,1).div(n) return delta class TernaryLinear(nn.Linear): def __init__(self,*args,**kwargs): super(TernaryLinear,self).__init__(*args,**kwargs) def forward(self,input): self.weight.data = Ternarize(self.weight.data) out = F.linear(input,self.weight,self.bias) return out class TernaryConv2d(nn.Conv2d): def __init__(self,*args,**kwargs): super(TernaryConv2d,self).__init__(*args,**kwargs) def forward(self,input): self.weight.data = Ternarize(self.weight.data) out = F.conv2d(input, self.weight.cuda(), self.bias, self.stride,self.padding, self.dilation, self.groups) return out class LeNet5_T(nn.Module): def __init__(self): super(LeNet5_T,self).__init__() self.conv1 = TernaryConv2d(1,32,kernel_size = 5) self.bn_conv1 = nn.BatchNorm2d(32) self.conv2 = TernaryConv2d(32,64,kernel_size = 5) self.bn_conv2 = nn.BatchNorm2d(64) self.fc1 = TernaryLinear(1024,512) self.fc2 = TernaryLinear(512,10) def forward(self,x): x = self.conv1(x) x = F.relu(F.max_pool2d(self.bn_conv1(x),2)) x = self.conv2(x) x = F.relu(F.max_pool2d(self.bn_conv2(x),2)) x = x.view(-1,1024) x = F.relu(self.fc1(x)) x = self.fc2(x) return x ``` githubに落ちているソースコードを多少変えています。 ### わかっていること epoch1回目はなぜかできる。 2回目から上記errorが出る。 loss = criterion(output, target)のoutputとtargetはcudaテンソルであると確認しました。 ### 補足情報（FW/ツールのバージョンなど） chainer v6.0.0 | NVIDIA-SMI 418.56 Driver Version: 418.56 CUDA Version: 10.1 ### 参考 https://github.com/buaabai/Ternary-Weights-Network

Accepted Answer

main.py の109行目辺りの
loss = criterion(output,target)
を
loss = nn.Parameter(criterion(output,target))
に変更することでとりあえず、上記のerrorは回避しましたが学習中もlossの値は下がらないという新しいerrorが出現しました。

pytorchでのgpu学習処理でエラーをなくしたい

発生している問題・エラーメッセージ

該当のソースコード

わかっていること

補足情報（FW/ツールのバージョンなど）

参考

関連した質問