現在, 深層学習を用いたビデオ分類(30秒のビデオ)を行なっています.
モデルとしては, 3DCNNを用いて,そのモデルに自作のgenerator(以下コード)で学習データを与えています.
しかし,上手く分類できませんでした.色々と動かしていたところ[ラベル0]は上手くラベル付けが行われているようですが,[ラベル1]がラベル付けが失敗?しているようです.
(詳細)データA(ラベル0),データB(ラベル1)を用意する.
データAのみを学習させるとaccが100%になる.
次にデータA(ラベル1)として,学習させるとaccが0%になる.
逆にデータB(ラベル1)の場合を学習させると,acc0%で全く認識できないが
データB(ラベル0)とするとacc100%で学習できる.
また,データA,Bの両方を学習に与えた場合,ラベル0の方のデータは正しく分類できるがラベル1の方のデータは全く分類できない.(A:B =6:4の場合,accはラベル0のみを認識してacc=60%となる.ラベルを逆にしても同じ.)
解決策が分かる方は,教えていただけると助かります.
また、説明が足りないところは言ってくださればすぐに説明したいと思います.
よろしくお願いします.
<環境>
python keras
google colab
python
1def generate_train(batch_size, train_sample_idx): 2 3 filelist = get_fileList() 4 while True: 5 num_training_sample = len(train_sample_idx) 6 batches = int(num_training_sample/batch_size) 7 remainder_samples = num_training_sample % batch_size 8 9 if remainder_samples: 10 batches = batches + 1 11 12 for idx in range(0,batches): 13 14 if idx == batches - 1: 15 batch_idxs = train_sample_idx[idx * batch_size:] 16 else : 17 batch_idxs = train_sample_idx[idx*batch_size:idx*batch_size+batch_size] 18 19 batch_idxs = sorted(batch_idxs) 20 21 22 videodatas_np, y = get_train_videodata(filelist,batch_idxs) 23 24 yield videodatas_np,y 25 26 27def get_train_videodata(filelist,batch_idxs): 28 29 X=[] 30 Y=[] 31 for i in batch_idxs: 32 count_frame = 0 33 cap = cv2.VideoCapture(filelist[i]) 34 video=[] 35 36 while(cap.isOpened()): 37 ret,frame = cap.read() 38 if not ret: 39 break 40 41 count_frame += 1 42 data = np.asarray(frame) 43 video.append(data) 44 45 if count_frame == 30: 46 video = np.array(video) 47 X.append(video) 48 49 # Y配列の作成 50 if 'ラベルA' in filelist[i]: 51 Y.append(0) 52 else: 53 Y.append(1) 54 55 X=np.array(X) 56 Y=np.array(Y) 57 58 Y=np_utils.to_categorical(Y,2) 59 60 return X,Y 61 62 63def get_fileList(): 64 fileList = glob.glob('./dataSet/**/**/*.avi') 65 return fileList
あなたの回答
tips
プレビュー