機械読唇をkerasで行っているのですが、Conv3Dを通して出力されたものをResnetに入力する方法がわかりません。
入力は96*96の25フレームの画像で、
(96,96,25,3)が入力となっています。
理想としてはMaxpooling3Dを通して出力された(32,32,25,64)で
1フレームごとに(32,32,64)でResnetに入力したいです。
Python
1ResNet = keras.applications.resnet50.ResNet50(include_top= False,weights=None, input_tensor=None, input_shape=(32,32,64),pooling=None, classes=25) 2 3 4model = Sequential() 5model.add(Conv3D(64, kernel_size=(3, 3, 3), input_shape=(X_train.shape[1:]), padding="same")) 6model.add(BatchNormalization()) 7model.add(Activation('relu')) 8model.add(MaxPooling3D(pool_size=(3, 3, 1))) 9model.add(Reshape((32,32,64))) 10model.add(ResNet)
Microsoft Visual Studio2017
tensorflow 2.4.1
keras2.4.3
Python 3.6.13
あなたの回答
tips
プレビュー