前提・実現したいこと
yolov5を用いて物体検出をしたい。
教えていただきたいこと
学習時に以下のエラーメッセージが表示され、学習がストップしてしまう。
CUDA out of memory. Tried to allocate 12.50 MiB (GPU 0; 10.92 GiB total capacity; 8.57 MiB already allocated; 9.28 GiB free; 4.68 MiB cached)
該当のソースコード
python train.py --img 640 --batch 32 --epochs 100 --data training/dataset.yaml --cfg training/yolov5x-custom.yaml --weights 'yolov5x.pt '
試したこと
・海外のサイトを読んだのですが、どう具体的にGPUの容量を減らしているのか分からなかったです。
・batch数を16に変更すると学習するのですが、損失関数の値が大きくなってしまいます。
・他のyolov5l.ptの場合、batch数32のエポック数100でも学習はできましたが、損失関数のグラフが横ばいになってしまいます。
補足情報(FW/ツールのバージョンなど)
参考サイト:
yolov5:https://github.com/ultralytics/yolov5.git
CUDA out of memoyの対策:https://github.com/pytorch/pytorch/issues/16417