🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

4229閲覧

GTX1060とRTX2080の処理速度

yone_yone

総合スコア28

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Ubuntu

Ubuntuは、Debian GNU/Linuxを基盤としたフリーのオペレーティングシステムです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

2グッド

3クリップ

投稿2019/09/19 13:27

編集2019/09/20 07:01

機械学習をGPUで回すときの処理速度についての質問になります。

以前、Tensorflowの簡単なプログラムをGTX1060を活用して回していたところ、
実行時間が約1分かかっていました。
現在はRTX2080を活用しているのですが、同様のプログラムを回すと。
約7分かかってしまいます。

私の中では、後者のGPUの方が性能が良いものだと考えていたので、
処理速度もかなり早くなると考えています。

これはGPUの設定の問題なのでしょうか?

以下にGPUの種類やドライバ等の詳細を記載しておきます。

GTX1060

101:00.0 VGA compatible controller: NVIDIA Corporation Device 1c3 (rev a1) 201:00.1 Audio device: NVIDIA Corporation Device 10f1 (rev a1) 3NVRM version: NVIDIA UNIX x86_64 Kernel Module 384.130 Wed Mar 21 03:37:26 PDT 2018 4GCC version: gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.11) 5 6memory:6072MiB 7

RTX2080

101:00.0 VGA compatible controller: NVIDIA Corporation GV102 (rev a1) 201:00.1 Audio device: NVIDIA Corporation Device 10f7 (rev a1) 301:00.2 USB controller: NVIDIA Corporation Device 1ad6 (rev a1) 401:00.3 Serial bus controller [0c80]: NVIDIA Corporation Device 1ad7 (rev a1) 5 6NVRM version: NVIDIA UNIX x86_64 Kernel Module 410.104 Tue Feb 5 22:58:30 CST 2019 7GCC version: gcc version 7.4.0 (Ubuntu 7.4.0-1ubuntu1~18.04.1) 8 9memory:10989MiB

以下にGPUを認識した際のログになります。

GTX1060

1>>> device_lib.list_local_devices() 22019-09-19 13:11:36.656233: I tensorflow/core/platform/cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA 32019-09-19 13:11:36.799838: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:898] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero 42019-09-19 13:11:36.800313: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1356] Found device 0 with properties: 5name: GeForce GTX 1060 6GB major: 6 minor: 1 memoryClockRate(GHz): 1.7085 6pciBusID: 0000:01:00.0 7totalMemory: 5.93GiB freeMemory: 5.86GiB 82019-09-19 13:11:36.800345: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0 92019-09-19 13:11:40.913458: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix: 102019-09-19 13:11:40.913573: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929] 0 112019-09-19 13:11:40.913613: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0: N 122019-09-19 13:11:40.969819: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/device:GPU:0 with 5641 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1060 6GB, pci bus id: 0000:01:00.0, compute capability: 6.1) 13[name: "/device:CPU:0" 14device_type: "CPU" 15memory_limit: 268435456 16locality { 17} 18incarnation: 2725849591917179920 19, name: "/device:GPU:0" 20device_type: "GPU" 21memory_limit: 5915803648 22locality { 23 bus_id: 1 24 links { 25 } 26} 27incarnation: 17210757529656703054 28physical_device_desc: "device: 0, name: GeForce GTX 1060 6GB, pci bus id: 0000:01:00.0, compute capability: 6.1" 29]

RTX2080

1>>> device_lib.list_local_devices() 22019-09-19 13:08:29.200675: I tensorflow/core/platform/cpu_feature_guard.cc:140] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA 32019-09-19 13:08:29.843699: I tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:898] successful NUMA node read from SysFS had negative value (-1), but there must be at least one NUMA node, so returning NUMA node zero 42019-09-19 13:08:29.844129: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1356] Found device 0 with properties: 5name: GeForce RTX 2080 Ti major: 7 minor: 5 memoryClockRate(GHz): 1.545 6pciBusID: 0000:01:00.0 7totalMemory: 10.73GiB freeMemory: 10.53GiB 82019-09-19 13:08:29.844144: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1435] Adding visible gpu devices: 0 92019-09-19 13:08:30.028718: I tensorflow/core/common_runtime/gpu/gpu_device.cc:923] Device interconnect StreamExecutor with strength 1 edge matrix: 102019-09-19 13:08:30.028754: I tensorflow/core/common_runtime/gpu/gpu_device.cc:929] 0 112019-09-19 13:08:30.028762: I tensorflow/core/common_runtime/gpu/gpu_device.cc:942] 0: N 122019-09-19 13:08:30.029023: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1053] Created TensorFlow device (/device:GPU:0 with 10177 MB memory) -> physical GPU (device: 0, name: GeForce RTX 2080 Ti, pci bus id: 0000:01:00.0, compute capability: 7.5) 13[name: "/device:CPU:0" 14device_type: "CPU" 15memory_limit: 268435456 16locality { 17} 18incarnation: 14902398693009919416 19, name: "/device:GPU:0" 20device_type: "GPU" 21memory_limit: 10672347546 22locality { 23 bus_id: 1 24 links { 25 } 26} 27incarnation: 1321506289675005500 28physical_device_desc: "device: 0, name: GeForce RTX 2080 Ti, pci bus id: 0000:01:00.0, compute capability: 7.5" 29]

環境:
tensorflow バージョン: 1.8.0
CUDA バージョン: 10.0

分かる方がいましたら、回答いただけると助かります。
※ご回答いただいた内容に質問させていただくこともあるかと思いますので、
※よろしければご返信いただければと思います。

maxtaq👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

hayataka2049

2019/09/20 01:55

他の条件がぜんぶ同じってわけでもなさそうなので、一応細かくマシンとソフトの構成を書いてみていただけませんか?
Wind

2019/09/20 02:14

RTX2080を活用するにはCUDA10に対応したTensorFlow-gpuが必要ですが、Kerasのバージョンが新しいと遅くなるパターンもあるみたいですね。 http://blog.abars.biz/archives/52458625.html
yone_yone

2019/09/20 06:39 編集

hayataka2049さん、 マシンとソフトの構成はCUDAやドライバのことでしょうか? この辺りの知識がまだ乏しいので、どのような構成を期待しているのか、ご教授願えないでしょうか?
tiitoi

2019/09/20 05:31

RTX2080 のほうでプログラム実行中に GPU が使用されていることは確認しているのでしょうか?(nvidia-smi の GPU-Util の欄) TensorFlow が要求する CUDA のバージョンがインストールされてなくて、CPU で実行されている可能性はないでしょうか
yone_yone

2019/09/20 06:38

tiitoiさん、 実行中にgpuが使用されていることは確認できました。
tiitoi

2019/09/20 06:42 編集

一応、質問欄に使用している TensorFlow 及び CUDA のバージョンを追記していただけますか。 また、速度の比較をする場合はバージョンによって変わってくるので、どちらも TensorFlow や CUDA/CuDNN のバージョンは同じものを使用して比較するべきではないでしょうか。
yone_yone

2019/09/20 07:06

tiitoiさん、 現環境のバージョンに関しては、質問の欄に追加いたしました。 比較の際のバージョンに関しましては、以前の環境ではnvidia-smiで確認したところ、CUDAのバージョンが記載されませんでした。 これは、CUDAがないという認識になるのでしょうか?
guest

回答1

0

ベストアンサー

環境:
tensorflow バージョン: 1.8.0
CUDA バージョン: 10.0

RTX2080 のほうでは TensorFlow 1.8.0 が要求する CUDA がインストールされていないため、CUDA ライブラリが見つけられなくて、CPU で実行されている可能性があります。
1.8.0 が要求する CUDA のバージョンは 9 です。
TensorFlow が要求する CUDA のバージョンがインストールされていないとダメです。

イメージ説明

ただ、RTX 20XX シリーズに対応しているのは CUDA 10 からだったと思うので、CUDA 9 を入れるのではなく、TensorFlow を一度アンインストールし、最新の stable 版である 1.14.0 をインストールしてください。1.14.0 は CUDA 10 を要求します。
また CuDNN のバージョンも 7.4 にする必要があります。

pip uninstall tensorflow-gpu -y pip install tensorflow-gpu

比較の際のバージョンに関しましては、以前の環境ではnvidia-smiで確認したところ、CUDAのバージョンが記載されませんでした。
これは、CUDAがないという認識になるのでしょうか?

ls /usr/local/ すると、そこに cuda-10.0 等のフォルダがあると思うので、それでバージョンを確認できます。

投稿2019/09/20 07:18

編集2019/09/20 07:22
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yone_yone

2019/09/24 13:11 編集

回答ありがとうございます。 非常に参考になりました。 cudaのバージョンのことなのですが、 ls/usr/local/ には、 cuda-9.0があります。 しかし、nvidia-smi ではCUDA Version: 10.0と出ます。 これについての原因として考えられることはありますでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問