質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

Q&A

0回答

1706閲覧

Pytorch GPUメモリの不足分が知りたい

Ryo5103

総合スコア0

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

0グッド

0クリップ

投稿2022/12/31 05:18

前提

Google Colab にて簡単なモデルを Pytorch で実装しました。
学習させてみたところ、メモリ不足でエラーとなり、下記メッセージが表示されます。

発生している問題・エラーメッセージ

CUDA out of memory. Tried to allocate 8.97 GiB (GPU 0; 14.76 GiB total capacity; 9.19 GiB already  allocated; 4.47 GiB free; 9.20 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

教えていただきたいこと

1. 上記メッセージの意味

14.76 GiB の全容量の内、9.19 は既に割り当てられている、4.47 GiB はまだ空いてる。
というところは理解できるのですが、 8.97 GiB 、9.20 GiB はどういう値なのでしょうか?
( 9.20 GiB がPyTorch全体として必要?、つまり9.20-4.17=4.73が不足分? )

2. Colab GPU の容量にズレがある理由

上記メッセージ前に!nvidia-smiで容量を調べたところ、15109 MiB=15.84 GiBと表示され、
エラーメッセージの値 (14.76 GiB) と若干差があります。
また、右上の使用容量グラフでは、RAM : xx GB / 12.68 GB と表示され、こことも差があります。
これらはそれぞれ何の値を示しているのでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

matukeso

2022/12/31 10:25

15109MiB=15109/1024GiB=14.754GiBですが、、 15.84は15109x1024x1024x1024/1e9で出ますが、あくまでGBであってGiBではありません。
jbpb0

2022/12/31 18:27

質問のタイトルの > GPUメモリの不足分 が、あとどれくらいメモリーが有れば学習が可能になるか、という意味ならば、質問に記載のエラーメッセージからは分からないと思います メモリー不足で落ちた時に確保しようとした量が > Tried to allocate 8.97 GiB だと思いますが、それが学習に必要な残り量の全てかは分かりません もしメモリー量の余裕がもう少し多くて、それが確保できたとしても、さらにメモリーを確保しようとして、メモリー不足で落ちるかもしれません
Ryo5103

2023/01/01 07:12

皆様、ありがとうございます。メッセージの意図は大凡理解出来ました。 またColabの右上の数字との乖離はGPUではなく通常のメモリ容量を表してるためかなとも考えたのですが、この認識が合っているのか、どなたか教えて頂けると幸いです。
jbpb0

2023/01/08 01:49

> Colabの右上の数字との乖離はGPUではなく ランタイム → ランタイムのタイプを変更 で、ハードウェアアクセラレータがNoneでも > 右上の使用容量グラフでは、RAM : xx GB / 12.68 GB と表示されるのだから、gpuのメモリーではないでしょうね
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問