質問編集履歴

書式の修正

2021/12/06 23:39

投稿

heets

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,6 +1,5 @@
 ###前提・実現したいこと
 PyTorchによるSSDを用いた物体検出の訓練について
 「作りながら学ぶ　PyTorchによる発展ディープラーニング」
 の第2章　「2-7_SSD_training.ipynb」
 において net = nn.DataParallel(net)を追加してマルチGPUで学習を実行した際に以下のエラーメッセージが表示されました。
@@ -200,7 +199,8 @@
 ```
 ### 試したこと
+シングルGPUでは問題なく動かすことができますが、net = nn.DataParallel(net)を実行すると上記のようなエラー文が出てしまいます。
-gpu_idを付与してみたりしましたがうまくいきませんでした。
+エラー文をインターネットで検索して出てきた解決方法は一通り行ってみました。
 ### 補足情報（FW/ツールのバージョンなど）

書式の改善

2021/12/06 23:39

投稿

heets

スコア0

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~作りながら学ぶ！！Pytorch発展ディープラーニング　第2章7節~~でのマルチGPUで学習しようとするとき、ギャザー関数がCPUテンソルに含まれていないとエラーが表示される
1	+ SSDでマルチGPUで学習しようとするとき、ギャザー関数がCPUテンソルに含まれていないとエラーが表示される

body CHANGED Viewed

File without changes

エラーメッセージの不足を追加

2021/12/06 18:16

投稿

heets

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -8,120 +8,75 @@
 ### 発生している問題・エラーメッセージ
 ```
-AssertionError: Gather function not implemented for CPU tensors
+AssertionError                            Traceback (most recent call last)
+<ipython-input-34-56fa4f8d86af> in <module>
+      1 # 学習・検証を実行する
+      2 num_epochs= 10
+----> 3 train_model(net, dataloaders_dict, criterion, optimizer, num_epochs=num_epochs)
+<ipython-input-33-645d91cb3a1e> in train_model(net, dataloaders_dict, criterion, optimizer, num_epochs)
+     60                 with torch.set_grad_enabled(phase == 'train'):
+     61                     # 順伝搬（forward）計算
+---> 62                     outputs = net(images)
-```
+     63
+     64                     # 損失の計算
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/modules/module.py in _call_impl(self, *input, **kwargs)
+    725             result = self._slow_forward(*input, **kwargs)
-### 該当のソースコード
+    726         else:
+--> 727             result = self.forward(*input, **kwargs)
+    728         for hook in itertools.chain(
+    729                 _global_forward_hooks.values(),
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/parallel/data_parallel.py in forward(self, *inputs, **kwargs)
+    160         replicas = self.replicate(self.module, self.device_ids[:len(inputs)])
+    161         outputs = self.parallel_apply(replicas, inputs, kwargs)
+--> 162         return self.gather(outputs, self.output_device)
-```python
+    163
-# パッケージのimport
-import os.path as osp
+    164     def replicate(self, module, device_ids):
-import random
-import time
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/parallel/data_parallel.py in gather(self, outputs, output_device)
-import cv2
+    172
-import numpy as np
-import pandas as pd
-import torch
-import torch.nn as nn
-import torch.nn.init as init
-import torch.optim as optim
+    173     def gather(self, outputs, output_device):
-import torch.utils.data as data
+--> 174         return gather(outputs, output_device, dim=self.dim)
+    175
+    176
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/parallel/scatter_gather.py in gather(outputs, target_device, dim)
+     66     # Setting the function to None clears the refcycle.
-# 乱数のシードを設定
+     67     try:
+---> 68         res = gather_map(outputs)
+     69     finally:
-torch.manual_seed(1234)
+     70         gather_map = None
-np.random.seed(1234)
-random.seed(1234)
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/parallel/scatter_gather.py in gather_map(outputs)
-from utils.ssd_model import make_datapath_list, VOCDataset, DataTransform, Anno_xml2list, od_collate_fn
+     61             return type(out)(((k, gather_map([d[k] for d in outputs]))
+     62                               for k in out))
+---> 63         return type(out)(map(gather_map, zip(*outputs)))
+     64
+     65     # Recursive function calls like this create reference cycles.
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/parallel/scatter_gather.py in gather_map(outputs)
+     53         out = outputs[0]
+     54         if isinstance(out, torch.Tensor):
+---> 55             return Gather.apply(target_device, dim, *outputs)
+     56         if out is None:
+     57             return None
+~/anaconda3/envs/vgg/lib/python3.6/site-packages/torch/nn/parallel/_functions.py in forward(ctx, target_device, dim, *inputs)
-# ファイルパスのリストを取得
+     54     def forward(ctx, target_device, dim, *inputs):
-rootpath = "./data/VOCdevkit/VOC2012/"
+     55         assert all(map(lambda i: i.device.type != 'cpu', inputs)), (
-train_img_list, train_anno_list, val_img_list, val_anno_list = make_datapath_list(
+---> 56             'Gather function not implemented for CPU tensors'
-    rootpath)
+     57         )
+     58         target_device = _get_device_index(target_device, True)
-# Datasetを作成
-voc_classes = ['aeroplane', 'bicycle', 'bird', 'boat',
-               'bottle', 'bus', 'car', 'cat', 'chair',
-               'cow', 'diningtable', 'dog', 'horse',
-               'motorbike', 'person', 'pottedplant',
+AssertionError: Gather function not implemented for CPU tensors
-               'sheep', 'sofa', 'train', 'tvmonitor']
-color_mean = (104, 117, 123)  # (BGR)の色の平均値
-input_size = 300  # 画像のinputサイズを300×300にする
-train_dataset = VOCDataset(train_img_list, train_anno_list, phase="train", transform=DataTransform(
-    input_size, color_mean), transform_anno=Anno_xml2list(voc_classes))
+```
-val_dataset = VOCDataset(val_img_list, val_anno_list, phase="val", transform=DataTransform(
-    input_size, color_mean), transform_anno=Anno_xml2list(voc_classes))
+### 該当のソースコード
-# DataLoaderを作成する
-batch_size = 64
-train_dataloader = data.DataLoader(
-    train_dataset, batch_size=batch_size, shuffle=True, collate_fn=od_collate_fn)
-val_dataloader = data.DataLoader(
-    val_dataset, batch_size=batch_size, shuffle=False, collate_fn=od_collate_fn)
-# 辞書オブジェクトにまとめる
-dataloaders_dict = {"train": train_dataloader, "val": val_dataloader}
-from utils.ssd_model import SSD
-# SSD300の設定
-ssd_cfg = {
-    'num_classes': 21,  # 背景クラスを含めた合計クラス数
-    'input_size': 300,  # 画像の入力サイズ
-    'bbox_aspect_num': [4, 6, 6, 6, 4, 4],  # 出力するDBoxのアスペクト比の種類
-    'feature_maps': [38, 19, 10, 5, 3, 1],  # 各sourceの画像サイズ
-    'steps': [8, 16, 32, 64, 100, 300],  # DBOXの大きさを決める
-    'min_sizes': [30, 60, 111, 162, 213, 264],  # DBOXの大きさを決める
-    'max_sizes': [60, 111, 162, 213, 264, 315],  # DBOXの大きさを決める
-    'aspect_ratios': [[2], [2, 3], [2, 3], [2, 3], [2], [2]],
-}
-# SSDネットワークモデル
-net = SSD(phase="train", cfg=ssd_cfg)
-# SSDの初期の重みを設定
-# ssdのvgg部分に重みをロードする
-vgg_weights = torch.load('./weights/vgg16_reducedfc.pth')
-net.vgg.load_state_dict(vgg_weights)
-# ssdのその他のネットワークの重みはHeの初期値で初期化
-def weights_init(m):
-    if isinstance(m, nn.Conv2d):
-        init.kaiming_normal_(m.weight.data)
-        if m.bias is not None:  # バイアス項がある場合
-            nn.init.constant_(m.bias, 0.0)
-# Heの初期値を適用
-net.extras.apply(weights_init)
-net.loc.apply(weights_init)
-net.conf.apply(weights_init)
-# GPUが使えるかを確認
-device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
-print("使用デバイス：", device)
-print('ネットワーク設定完了：学習済みの重みをロードしました')
-from utils.ssd_model import MultiBoxLoss
-# 損失関数の設定
+```python
-criterion = MultiBoxLoss(jaccard_thresh=0.5, neg_pos=3, device=device)
-# 最適化手法の設定
-optimizer = optim.SGD(net.parameters(), lr=1e-3,
-                      momentum=0.9, weight_decay=5e-4)
 # モデルを学習させる関数を作成