深層学習における自作video generatorのラベル付け.

現在, 深層学習を用いたビデオ分類(30秒のビデオ)を行なっています.

モデルとしては, 3DCNNを用いて,そのモデルに自作のgenerator(以下コード)で学習データを与えています.

しかし,上手く分類できませんでした.色々と動かしていたところ[ラベル0]は上手くラベル付けが行われているようですが,[ラベル1]がラベル付けが失敗？しているようです.

(詳細)データA(ラベル0),データB(ラベル1)を用意する.
データAのみを学習させるとaccが100%になる.
次にデータA(ラベル1)として,学習させるとaccが0%になる.

逆にデータB(ラベル1)の場合を学習させると,acc0%で全く認識できないが
データB(ラベル0)とするとacc100%で学習できる.

また,データA,Bの両方を学習に与えた場合,ラベル0の方のデータは正しく分類できるがラベル1の方のデータは全く分類できない.(A:B =6:4の場合,accはラベル0のみを認識してacc=60%となる.ラベルを逆にしても同じ.)

解決策が分かる方は,教えていただけると助かります.
また、説明が足りないところは言ってくださればすぐに説明したいと思います.
よろしくお願いします.

<環境>
python keras
google colab

python
1def generate_train(batch_size, train_sample_idx):
2    
3    filelist = get_fileList()
4    while True:
5        num_training_sample = len(train_sample_idx)
6        batches = int(num_training_sample/batch_size)
7        remainder_samples = num_training_sample % batch_size
8    
9        if remainder_samples:
10            batches = batches + 1
11     
12        for idx in range(0,batches):
13             
14            if idx == batches - 1:
15                batch_idxs = train_sample_idx[idx * batch_size:]
16            else :
17                batch_idxs = train_sample_idx[idx*batch_size:idx*batch_size+batch_size]
18            
19            batch_idxs = sorted(batch_idxs)
20            
21           
22            videodatas_np, y = get_train_videodata(filelist,batch_idxs)
23          
24            yield videodatas_np,y  
25        
26
27def get_train_videodata(filelist,batch_idxs):
28    
29    X=[]
30    Y=[]
31    for i in batch_idxs:
32        count_frame = 0   
33        cap = cv2.VideoCapture(filelist[i])
34        video=[]
35      
36        while(cap.isOpened()):
37            ret,frame = cap.read()
38            if not ret:
39                break
40            
41            count_frame += 1
42            data = np.asarray(frame)
43            video.append(data)
44            
45        if count_frame == 30:
46            video = np.array(video)
47            X.append(video)
48        
49            # Y配列の作成
50            if 'ラベルA' in filelist[i]:
51                Y.append(0)
52            else:
53                Y.append(1)
54       
55    X=np.array(X)   
56    Y=np.array(Y)
57    
58    Y=np_utils.to_categorical(Y,2)
59    
60    return X,Y
61
62
63def get_fileList():
64    fileList = glob.glob('./dataSet/**/**/*.avi')
65    return fileList

Q71

2019/12/16 11:49

> (詳細)データA(ラベル0),データB(ラベル1)を用意する. データAのみを学習させるとaccが100%になる. 次にデータA(ラベル1)として,学習させるとaccが0%になる. 全く意味がわかりません。ラベル0のデータをラベル1として学習させる？なぜ？コードを載せるのもいいのですが、自分がやりたいことをコンピュータに解るように「説明したもの」がコードです。ではそのコードの元になっているはずの「仕様」を、人に説明してください。人に説明できないものを、コンピュータに、本当に説明できているのでしょうか？