質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

Q&A

1回答

2387閲覧

torch._C._cuda_init() RuntimeError: CUDA error: out of memory

退会済みユーザー

退会済みユーザー

総合スコア0

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

0グッド

0クリップ

投稿2021/12/08 12:55

前提・実現したいこと

python3.8
RTX 3060
cuda11.0
torch 1.10.0+cu113
torchaudio 0.10.0+cu113
torchvision 0.11.1+cu113を使用しています。
torchに関しましては以前、cuda11.0に合わせて1.7.1を使おうとしましたがエラーが出ていたので上記のものを使用しています。

下記のようなエラーが発生したのですがなぜこのようなエラーが起きてしまうのでしょうか。
申し訳ございませんがよろしくお願い致します。

発生している問題・エラーメッセージ

Traceback (most recent call last): File "/program/main/main1_EN.py", line 597, in <module> main() File "/program/main/main1_EN.py", line 592, in main m.process() File "/main/main1_EN.py", line 136, in process model.cuda() File "/.local/lib/python3.8/site-packages/torch/nn/modules/module.py", line 680, in cuda return self._apply(lambda t: t.cuda(device)) File "/.local/lib/python3.8/site-packages/torch/nn/modules/module.py", line 570, in _apply module._apply(fn) File "/.local/lib/python3.8/site-packages/torch/nn/modules/module.py", line 570, in _apply module._apply(fn) File /.local/lib/python3.8/site-packages/torch/nn/modules/module.py", line 570, in _apply module._apply(fn) File "/.local/lib/python3.8/site-packages/torch/nn/modules/module.py", line 593, in _apply param_applied = fn(param) File "/.local/lib/python3.8/site-packages/torch/nn/modules/module.py", line 680, in <lambda> return self._apply(lambda t: t.cuda(device)) File "/.local/lib/python3.8/site-packages/torch/cuda/__init__.py", line 214, in _lazy_init torch._C._cuda_init() RuntimeError: CUDA error: out of memory

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

CUDA error: out of memory なので、単純に GPU のメモリが不足しています。
バッチサイズをエラーがでなくなるまで小さい値にしてみてください。

投稿2021/12/08 14:25

tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/12/08 18:30

ご返信ありがとうございます。 また、度々申し訳ございません。 こちらが正しい位置なのか自信がないのですが .local/lib/python3.8/site-packages/torch/utils/data/dataloader_experimental.pyを見たところ、下記のようにバッチサイズが1となっていました。 申し訳ございませんがご教示いただけますでしょうか。 class DataLoader2: def __new__(cls, dataset, batch_size=1,
tiitoi

2021/12/08 19:01 編集

それはデフォルト値です。DataLorderを作成するときにバッチサイズを設定していませんか?質問欄に学習のコードを貼っていただけますか?
退会済みユーザー

退会済みユーザー

2021/12/09 03:37

ご返信ありがとうございます。 >DataLorderを作成するとき class DataLoaderをお見せすればよいでしょうか。 お手数お掛けして申し訳ございません。 また、今回はこちらのpytorch yolov3を実装しています。 https://github.com/ayooshkathuria/pytorch-yolo-v3/blob/master/cam_demo.py
tiitoi

2021/12/09 04:00

すでにbatchsize=1になっていますね RTX3060は12GBメモリあったはずなので足りるはずですが、なぜメモリ不足になるのかはすいませんがわからないです
退会済みユーザー

退会済みユーザー

2021/12/09 04:34

ありがとうございます。 おそらくですが、動画としてこちら(下記のコード)のbagファイルを使っていまして、それがgpuの30%ほど占めています。また、yoloを通すとgpuの60%ほど占めてしまいます。 それ以外も、imagecaptioningなどを組み込んでいるためメモリ不足となっているのかもしれないです。 config.enable_device_from_file('/media/limlab/48A9A14C31288186/12_2_thu.bag',repeat_playback=False)
tiitoi

2021/12/09 07:03

全体のシステムがどうなってるのか詳しくはわからないですが、メモリが足りないのは、メモリ使用量削減する以外どうしようもないです
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問