質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

1回答

1158閲覧

GPUを使用したDnCNN学習時の損失が低下しない

xeno

総合スコア16

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2021/10/26 14:41

DnCNNをGPUを使用して学習しようとしているのですが損失が約1億程度となっており、そこから低下しない状況です。
DnCNNはこのLINKのものを使用しています。
一部の変数を下記のように変更しています。

変更前 → 変更後 epoch_iter=2000 → epoch_iter=1000 steps_per_epoch=2000 → steps_per_epoch=1000

環境

GPU:GeForce RTX 3080 Lite Hash Rate nvidia driver:460 CUDA:10.0 cudnn:7.4 ubntu18.04 python3.6 tensorflow:1.14.0 Keras:2.2.5

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/10/27 05:39 編集

> DnCNNをGPUを使用して学習しようとしているのですが損失が約1億程度となっており、そこから低下しない Google ColabでGPU使ってやってみましたけど、大丈夫でした 時間かかるので、2Epochまでしかやってませんけど、その時のlossは下記の通りでした Epoch 1/300 2000/2000 [==============================] - 922s 461ms/step - loss: 391.5548 Epoch 2/300 2000/2000 [==============================] - 908s 454ms/step - loss: 202.2874 コードは、「main_train.py」の69行目のタブでエラーが出るので、それをスペースに置き換えただけ、他はそのままです ディレクトリ配置は、 https://github.com/cszn/DnCNN/tree/master/TrainingCodes/dncnn_keras の画像に合わせました 下記をGoogle Colabにインストールして使いました tensorflow-gpu 1.15.3 keras 2.3.1
jbpb0

2021/10/27 08:07

GPU有りWin 10パソコンでもやってみましたが、そちらでも大丈夫でした 5Epochまでですが、その時のlossは下記の通りでした Epoch 1/300 2000/2000 [==============================] - 266s 133ms/step - loss: 387.0488 Epoch 2/300 2000/2000 [==============================] - 251s 126ms/step - loss: 204.9236 Epoch 3/300 2000/2000 [==============================] - 253s 126ms/step - loss: 192.3130 Epoch 4/300 2000/2000 [==============================] - 252s 126ms/step - loss: 185.2777 Epoch 5/300 2000/2000 [==============================] - 257s 129ms/step - loss: 181.0284 コードとディレクトリ配置は、Google Colabの時と同じです 環境 Win 10 GTX 1080 Ti CUDA 10.0 cuDNN 7.4 Python 3.7.10 tensorflow-gpu 1.15.3 Keras 2.3.1
xeno

2021/10/27 09:36

確認していただきありがとうございます。 CUDA11の件なのですが下記のLINKによるとtensorflowがCUDA10までしか対応していないように思うのですが使用できるのでしょうか。
jbpb0

2021/10/27 13:02

TensorFlowはバージョンによって、組み合わせて使えるCUDAとcuDNNのバージョンが決まってます https://www.tensorflow.org/install/source?hl=jahttps://www.tensorflow.org/install/source_windows?hl=ja の「テスト済みのビルド構成」の表に書かれてるバージョンなら、ほぼ使えるはずです どれかのバージョンでは表が間違ってましたが、ほとんどは合ってると思います Ampereアーキテクチャに対応してるCUDA 11.*との組み合わせだと、上記の表によると使えるのはTensorFlow 2.4.0以降になります
guest

回答1

0

ベストアンサー

DnCNNをGPUを使用して学習しようとしているのですが損失が約1億程度となっており、そこから低下しない

Google ColabでGPU使ってやってみましたけど、大丈夫なようでした
時間かかるので、2Epochまでしかやってませんけど、その時のlossは下記の通りでした
Epoch 1/300
2000/2000 [==============================] - 922s 461ms/step - loss: 391.5548
Epoch 2/300
2000/2000 [==============================] - 908s 454ms/step - loss: 202.2874

コードは、「main_train.py」の69行目のタブでエラーが出るので、それをスペースに置き換えただけ、他はそのままです

ディレクトリ配置は、
DnCNN-keras
の画像に合わせました

実行前に、下記をGoogle Colabにインストールして、使いました
tensorflow-gpu 1.15.3
keras 2.3.1

投稿2021/10/28 02:47

jbpb0

総合スコア7651

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xeno

2021/10/28 03:33

ありがとうございました。 Dockerなどの仮想環境を試すかGPUを変えることを検討します。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問