質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

1回答

1173閲覧

train_mnist.pyの実行に時間がかかりすぎる

soychance

総合スコア12

Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2021/07/30 02:18

機械学習を始めたいと思い環境構築をしました。
-g 0でgpuの使用を明示しているにもかかわらずtrain_mnist.pyの実行に900秒程度かかってしまいます。
原因を教えていただけないでしょうか。

C:\ProgramData\chainer-7.8.0>python examples\mnist\train_mnist.py -g 0 -b 1500 Device: @cupy:0 # unit: 1000 # Minibatch-size: 1500 # epoch: 20 epoch main/loss validation/main/loss main/accuracy validation/main/accuracy elapsed_time 0 2.3265 0.0515714 859.228 1 0.48032 0.195589 0.869167 0.940667 860.161 2 0.158492 0.125621 0.95365 0.962619 860.815 3 0.0999118 0.0941944 0.9707 0.971667 861.457 4 0.0695111 0.0802495 0.9795 0.975 862.085 5 0.0499488 0.0681796 0.9854 0.978429 862.724 6 0.0368966 0.065861 0.989734 0.978809 863.368 7 0.027187 0.062145 0.9928 0.980667 863.999 8 0.0194825 0.0647975 0.99555 0.979571 864.637 9 0.0157894 0.062429 0.9962 0.980381 865.289 10 0.0118151 0.0614116 0.997266 0.981286 865.909 11 0.00973346 0.0638975 0.9978 0.98081 866.538 12 0.00625662 0.0583647 0.999066 0.983762 867.156 13 0.00362722 0.0605896 0.999716 0.982714 867.785 14 0.00320617 0.062173 0.9996 0.981809 868.413 15 0.00237801 0.0629674 0.999917 0.982428 869.046 16 0.00166276 0.0621309 0.99995 0.98319 869.684 17 0.00120913 0.0647811 1 0.982619 870.355 18 0.000988056 0.0649959 1 0.982714 871 19 0.000849792 0.0659892 1 0.983 871.634 20 0.000712159 0.0670029 1 0.982381 872.268

以下、実行環境

CPU:Corei7-10700 GPU:GeForce RTX 3070 メモリ:DDR4 3200MHz 16GB
>>> chainer.print_runtime_info() Platform: Windows-10-10.0.19041-SP0 Chainer: 7.8.0 ChainerX: Not Available NumPy: 1.20.1 CuPy: CuPy Version : 7.7.0 CUDA Root : C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1 CUDA Build Version : 10010 CUDA Driver Version : 11040 CUDA Runtime Version : 10010 cuBLAS Version : 10100 cuFFT Version : 10010 cuRAND Version : 10010 cuSOLVER Version : (10, 1, 0) cuSPARSE Version : 10010 NVRTC Version : (10, 1) cuDNN Build Version : 7605 cuDNN Version : 7605 NCCL Build Version : None NCCL Runtime Version : None CUB Version : None cuTENSOR Version : None iDeep: Not Available

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

GPU:GeForce RTX 3070

CUDA Root : C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1

CUDA, cuDNN, ドライバのバージョンを、
cuDNN Support Matrix
でAmpere architecture(GeForce RTX 30)対応と書かれてるものに合わせたら、直ると思います

TensorFlowでは、それで直ってますので
tensorflow-GPUのGPU認識に時間がかかる
Anaconda上のTensorflow GPU版を使うとき、処理の初期化の時間が長すぎる

投稿2021/07/30 08:26

jbpb0

総合スコア7653

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

soychance

2021/07/30 11:34

まさしくその通りでした! 結果的にはcuda11.0を入れなおしてうまくいきました! 本当にありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問