質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3362閲覧

CupyでのGPU使用率が上がらない

PEMPEM

総合スコア35

CUDA

CUDAは並列計算プラットフォームであり、Nvidia GPU(Graphics Processing Units)向けのプログラミングモデルです。CUDAは様々なプログラミング言語、ライブラリ、APIを通してNvidiaにインターフェイスを提供します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/05/25 00:24

編集2021/05/25 00:32

train_mnistにてGPU仕様率が上がらない

Pythonでtrain_mnistを走らせましたが、GPU使用率が12%程度になっています。
終了まで120秒程度かかってます。

環境
CPU E5-2670 8C16T キャッシュ20MB
MEM DDR3 16G
GPU GTX-1070 PCI-Eは2.0です。

試したこと

batchsizeを100から1000に変更したところ、使用率40%程度まで上がりました。
終了まで40秒程度掛かります。

bachsizeは1000のままで、unitを1000から1500に変更したところ、使用率80%程度まで上がりました。
終了まで40秒程度です。

どれもCPU使用率は20%程度です。

CPU-GPUU間のデータ渡しがボトルネック等との意見がWEB上で見られますが
メモリーがDDR3と1世代前だから? PCI-Eが2.0だから?
メモリーもPCI-Eも現行より転送速度が遅いのですが、ここまで影響が出るものでしょうか。

補足情報(FW/ツールのバージョンなど)

windows10 64bit
cuda 10.1
python3.8
ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/05/25 00:35

Cupyで、ということは、Chainer使ってるのですか?
PEMPEM

2021/05/25 00:39

すみませんでした。 Chainerを使っています。 よろしくお願いします。
quickquip

2021/05/25 02:39 編集

「問題が簡単すぎる」「モデルが小さい」で済む話ではない何かが聞きたいのでしょうか? 疑問点がピンとこなかったです。 エポックはデフォルトの20なのでしょうか。
PEMPEM

2021/05/25 03:36

すみません。 初めてGPUで学習できる環境をと問えました。 ベンチで回した結果とwebで見たGTX1060の結果よりかなり遅い結果となっていたので、GPU使用量を確認しました。 エポックはデフォルトの20で回してます。
quickquip

2021/05/25 04:15

使用率というよりは、かかる時間の方が問題なのですね。 「webで見たGTX1060の結果」のページが知りたいように思います。
PEMPEM

2021/05/25 04:28

ありがとうございました。 ご紹介いただいたページでもGPU使用率は低いようですね。 処理時間の違いはメモリーとPCI-Eの違いのようですね。 ありがとうございました。
PEMPEM

2021/05/25 05:03

いろいろありがとうございます。 後ほど実行して結果ご報告いたします。
guest

回答1

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

PEMPEM

2021/05/25 11:18

沢山の情報をいただきありがとうございました. train_cifar.py回した結果常時使用率95%前後で回ってました. 終了まで5時間ほど掛かりました。 train_mnist.pyではGPU使用率は上がらないようですね。 他の方より遅いのは少し気になりますが ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問