質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

3630閲覧

CUDNN_STATUS_INTERNAL_ERRORを解消したい

kodai0505

総合スコア8

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/08/28 06:50

#問題点
参考にしているサイトでローカル環境でyolov5を学習しているのですが、モデルに学習させる部分(train.py)で
[RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR]
とcuDNNの部分でエラーが表示されます。
素人質問で申し訳ございませんが対処法を教えていただけると幸いです。

#エラー内容

Epoch gpu_mem box obj cls labels img_size 0%| | 0/14 [00:00<?, ?it/s]fatal : Memory allocation failure 0%| | 0/14 [00:01<?, ?it/s] Traceback (most recent call last): File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\train.py", line 602, in <module> main(opt) File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\train.py", line 500, in main train(opt.hyp, opt, device) File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\train.py", line 317, in train pred = model(imgs) # forward File "C:\Users\hasebe\YOLO\yolov5_kinoko\yolov5\venv-yolov5\lib\site-packages\torch\nn\modules\module.py", line 1051, in _call_impl return forward_call(*input, **kwargs) File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\models\yolo.py", line 123, in forward return self.forward_once(x, profile, visualize) # single-scale inference, train File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\models\yolo.py", line 155, in forward_once x = m(x) # run File "C:\Users\hasebe\YOLO\yolov5_kinoko\yolov5\venv-yolov5\lib\site-packages\torch\nn\modules\module.py", line 1051, in _call_impl return forward_call(*input, **kwargs) File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\models\common.py", line 205, in forward return self.conv(torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1)) File "C:\Users\hasebe\YOLO\yolov5_kinoko\yolov5\venv-yolov5\lib\site-packages\torch\nn\modules\module.py", line 1051, in _call_impl return forward_call(*input, **kwargs) File "C:\Users\hasebe\YOLO\yolov5_mask\yolov5\models\common.py", line 44, in forward return self.act(self.bn(self.conv(x))) File "C:\Users\hasebe\YOLO\yolov5_kinoko\yolov5\venv-yolov5\lib\site-packages\torch\nn\modules\module.py", line 1051, in _call_impl return forward_call(*input, **kwargs) File "C:\Users\hasebe\YOLO\yolov5_kinoko\yolov5\venv-yolov5\lib\site-packages\torch\nn\modules\conv.py", line 443, in forward return self._conv_forward(input, self.weight, self.bias) File "C:\Users\hasebe\YOLO\yolov5_kinoko\yolov5\venv-yolov5\lib\site-packages\torch\nn\modules\conv.py", line 439, in _conv_forward return F.conv2d(input, weight, bias, self.stride, RuntimeError: cuDNN error: CUDNN_STATUS_INTERNAL_ERROR

#背景
CUDAとcuDNNは以下のサイトでインストールしました。
リンク内容

問題点の部分で記載した参考にしているサイトに合わせて

CUDAは
イメージ説明

cuDNNは
イメージ説明

をインストールしました。

PyTorchは以下のものをインストールしました。
イメージ説明

#確認事項
CUDAとcuDNNはコマンドプロンプトで確認済みです。
イメージ説明

pytorchも確認できました。
イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/08/28 11:33

GPUの処理は非同期なので、現状で「Traceback」以降に表示されてることがエラーの原因ではないかもしれません そこで、下記のようにする方がいいようです ・GPUを使わずCPUのみでの実行でもエラーになるなら、その時の「Traceback」以降に表示されてることを参照する ・CPUのみの実行ではエラーにならないなら、コードの一番最初に下記を追加してからGPUを使って実行して、その時の「Traceback」以降に表示されてることを参照する import os os.environ['CUDA_LAUNCH_BLOCKING'] = "1" 参考 https://torch.classcat.com/2018/05/25/pytorch-docs-notes-cuda/ の「非同期実行」 https://lernapparat.de/debug-device-assert/ https://discuss.pytorch.org/t/runtimeerror-cuda-runtime-error-710-device-side-assert-triggered-at-pytorch-aten-src-thc-generic-thctensormath-cu-26/73167 のptrblckさんの最初のコメント
kodai0505

2021/08/29 03:06

返信いただき誠にありがとうございます! たった2文を入れるだけで成功することができました! お忙しいところご教授いただき誠にありがとうございます!
jbpb0

2021/08/29 03:23

os.environ['CUDA_LAUNCH_BLOCKING'] = "1" を設定すると、たぶん遅くなります 本来は、これを指定しなくてもエラーが出ないようにしないといけないのです https://farml1.com/yolov5/#toc3 の「YOLOv5の仮想環境設定」には 「最新バージョンだとうまく動かず。v1.7.1であればOKでした。」 と書かれてるので、PyTorchのバージョンを1.9.0から1.7.1に変えたら直るかも
kodai0505

2021/08/29 05:47

pip3で1.7.1に変えたのですが、エラーが返されました。 (venv-yolov5) C:\Users\hasebe kodai\YOLO\yolov5_hand>pip3 install torch==1.7.1+cu111 torchvision==0.10.0+cu111 torchaudio===0.9.0 -f https://download.pytorch.org/whl/torch_stable.html Looking in links: https://download.pytorch.org/whl/torch_stable.html ERROR: Could not find a version that satisfies the requirement torch==1.7.1+cu111 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2, 1.4.0, 1.4.0+cpu, 1.4.0+cu92, 1.5.0, 1.5.0+cpu, 1.5.0+cu101, 1.5.0+cu92, 1.5.1, 1.5.1+cpu, 1.5.1+cu101, 1.5.1+cu92, 1.6.0, 1.6.0+cpu, 1.6.0+cu101, 1.7.0, 1.7.0+cpu, 1.7.0+cu101, 1.7.0+cu110, 1.7.1, 1.7.1+cpu, 1.7.1+cu101, 1.7.1+cu110, 1.8.0, 1.8.0+cpu, 1.8.0+cu101, 1.8.0+cu111, 1.8.1, 1.8.1+cpu, 1.8.1+cu101, 1.8.1+cu102, 1.8.1+cu111, 1.9.0, 1.9.0+cpu, 1.9.0+cu102, 1.9.0+cu111) ERROR: No matching distribution found for torch==1.7.1+cu111 WARNING: You are using pip version 20.1.1; however, version 21.2.4 is available. You should consider upgrading via the 'c:\users\hasebe kodai\yolo\yolov5_venv\venv-yolov5\scripts\python.exe -m pip install --upgrade pip' command.
kodai0505

2021/08/30 02:33

具体的にCUDAとcuDNNのバージョンを教えていただけると助かります。 出来れば確認の仕方を教えていただけると幸いです。
jbpb0

2021/08/30 03:08 編集

> 具体的にCUDAとcuDNNのバージョンを > 確認の仕方 ですから、上に書いた通り、 https://pytorch.org/get-started/previous-versions/#linux-and-windows-3 の「v1.7.1」の「Wheel」の「Linux and Windows」のところに書いてあるCUDAのバージョンですよ 今見たら9.2, 10.1, 10.2, 11.0って書いてあるから、そこから選んでCUDAを入れて、pip install...コマンドもそこに書いてあるので、その通りに実行したらインストールできるのではないですかね cuDNNに付いては、ざっと見たところ何も書かれてないようなので、上記から選んだCUDAバージョンに対応するものを選んだら、どれでもいいのではないですかね
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問