自前データで学習する際にエラーがでてつまずいてしまい、質問させていただきました。
ご教授いただけると幸いです。
環境
ubuntu16.0.4
gpu:GeForce gtx640
yolov2
cuda8.0
<参考サイト>
http://demura.net/misc/14458.html
https://qiita.com/harmegiddo/items/c3db5fd567fa4c6cc9fb
src |-darknet |- cfg |- task |- dataset.data |- class.txt |- train.txt |- test.txt |- train.cfg |- backup |- img.dataset |- img(1).jpg |- img(1).txt |- img(2).jpg |- img(2).txt |- ...
dataset.dataの中身が
classes=1 train = /home/user/src/darknet/cfg/task/train.list valid = /home/useer/src/darknet/cfg/task/test.list names = /home/user/src/darknet/cfg/task/names.list backup = /home/user/src/darknet/cfg/task/backup
train.txtの中身が
/home/user/src/darknet/cfg/task/img.dataset/img (10).jpg /home/uaer/src/darknet/cfg/task/img.dataset/img (100).jpg /home/uaer/src/darknet/cfg/task/img.dataset/img (101).jpg /home/uaer/src/darknet/cfg/task/img.dataset/img (102).jpg /home/uaer/src/darknet/cfg/task/img.dataset/img (104).jpg /home/uaer/src/darknet/cfg/task/img.dataset/img (105).jpg
例えばimg(1).txtの中身が
0 0.435937 0.033333 0.190625 0.058333
tarain.cfgの中身が
[net] # Testing #batch=1 #subdivisions=1 # Training batch=20 #変更 subdivisions=20 #変更 height=416 width=416 channels=1 momentum=0.9 decay=0.0005 angle=0 saturation = 1.5 exposure = 1.5 hue=.1 ・ ・ ・ [convolutional] size=1 stride=1 pad=1 filters=30 #変更 activation=linear [region] anchors = 1.3221, 1.73145, 3.19275, 4.00944, 5.05587, 8.09892, 9.47112, 4.84053, 11.2364, 10.0071 bias_match=1 classes=1 #変更 coords=4 num=5 softmax=1 jitter=.3 rescore=1 object_scale=5 noobject_scale=1 class_scale=1 coord_scale=1 absolute=1 thresh = .6 random=1
学習を始める
./darknet detector train cfg/task/dataset.data cfg/task/train.cfg darknet19_448.conv.23
ayer filters size input output 0 conv 18 3 x 3 / 1 416 x 416 x 1 -> 416 x 416 x 18 0.056 BFLOPs 1 max 2 x 2 / 2 416 x 416 x 18 -> 208 x 208 x 18 2 conv 18 3 x 3 / 1 208 x 208 x 18 -> 208 x 208 x 18 0.252 BFLOPs 3 max 2 x 2 / 2 208 x 208 x 18 -> 104 x 104 x 18 4 conv 18 3 x 3 / 1 104 x 104 x 18 -> 104 x 104 x 18 0.063 BFLOPs 5 conv 18 1 x 1 / 1 104 x 104 x 18 -> 104 x 104 x 18 0.007 BFLOPs 6 conv 18 3 x 3 / 1 104 x 104 x 18 -> 104 x 104 x 18 0.063 BFLOPs 7 max 2 x 2 / 2 104 x 104 x 18 -> 52 x 52 x 18 8 conv 18 3 x 3 / 1 52 x 52 x 18 -> 52 x 52 x 18 0.016 BFLOPs 9 conv 18 1 x 1 / 1 52 x 52 x 18 -> 52 x 52 x 18 0.002 BFLOPs 10 conv 18 3 x 3 / 1 52 x 52 x 18 -> 52 x 52 x 18 0.016 BFLOPs 11 max 2 x 2 / 2 52 x 52 x 18 -> 26 x 26 x 18 12 conv 18 3 x 3 / 1 26 x 26 x 18 -> 26 x 26 x 18 0.004 BFLOPs 13 conv 18 1 x 1 / 1 26 x 26 x 18 -> 26 x 26 x 18 0.000 BFLOPs 14 conv 18 3 x 3 / 1 26 x 26 x 18 -> 26 x 26 x 18 0.004 BFLOPs 15 conv 18 1 x 1 / 1 26 x 26 x 18 -> 26 x 26 x 18 0.000 BFLOPs 16 conv 18 3 x 3 / 1 26 x 26 x 18 -> 26 x 26 x 18 0.004 BFLOPs 17 max 2 x 2 / 2 26 x 26 x 18 -> 13 x 13 x 18 18 conv 18 3 x 3 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.001 BFLOPs 19 conv 18 1 x 1 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.000 BFLOPs 20 conv 18 3 x 3 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.001 BFLOPs 21 conv 18 1 x 1 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.000 BFLOPs 22 conv 18 3 x 3 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.001 BFLOPs 23 conv 18 3 x 3 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.001 BFLOPs 24 conv 18 3 x 3 / 1 13 x 13 x 18 -> 13 x 13 x 18 0.001 BFLOPs 25 route 16 26 conv 18 1 x 1 / 1 26 x 26 x 18 -> 26 x 26 x 18 0.000 BFLOPs 27 reorg / 2 26 x 26 x 18 -> 13 x 13 x 72 28 route 27 24 29 conv 18 3 x 3 / 1 13 x 13 x 90 -> 13 x 13 x 18 0.005 BFLOPs 30 conv 30 1 x 1 / 1 13 x 13 x 18 -> 13 x 13 x 30 0.000 BFLOPs 31 detection mask_scale: Using default '1.000000' Loading weights from darknet19_448.conv.23...Done! Learning Rate: 0.001, Momentum: 0.9, Decay: 0.0005 Resizing 576 Loaded: 0.051745 seconds Segmentation fault (コアダンプ)
nvidia
1+-----------------------------------------------------------------------------+ 2| NVIDIA-SMI 410.78 Driver Version: 410.78 CUDA Version: 10.0 | 3|-------------------------------+----------------------+----------------------+ 4| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | 5| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | 6|===============================+======================+======================| 7| 0 GeForce GTX 645 Off | 00000000:01:00.0 N/A | N/A | 8| 30% 36C P8 N/A / N/A | 238MiB / 974MiB | N/A Default | 9+-------------------------------+----------------------+----------------------+ 10 11+-----------------------------------------------------------------------------+ 12| Processes: GPU Memory | 13| GPU PID Type Process name Usage | 14|=============================================================================| 15| 0 Not Supported | 16+-----------------------------------------------------------------------------+ 17
nvcc
1nvcc: NVIDIA (R) Cuda compiler driver 2Copyright (c) 2005-2016 NVIDIA Corporation 3Built on Mon_Jan_23_12:24:11_CST_2017 4Cuda compilation tools, release 8.0, V8.0.62
対策
sudoをつけて実行する
パスの確認をする
思い当たる点としてドライバのバージョンが最新版でありnvidia-smiに表記されるCUDA Version: 10.0 のcudaとのバージョン違いなのでしょうか?
gpuが古いこともあって、cuda8.0対応のドライバが公式になく、410.78を入れてしまいました。
なにかアドバイスをいただけると助かります。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。