学習の再現性を確保したい
Kerasで回帰問題のプログラムを作っています
学習の再現をしたく,Qiitaにて書かれているソースをコピーして試したのですが画像のように異なるlossになります
また,画像はAtomで作成したpythonファイルをローカルで実行したものですが,Jupyter Notebookで試しても再現されませんでした
以下,使用しているモデルとオプションです
環境
- Python 3.6.6
- Tensorflow 1.11.0
- Keras 2.2.4
Python
1config = tf.ConfigProto(allow_soft_placement=True) 2config.gpu_options.allow_growth = True 3K.set_session(tf.Session(config=config)) 4 5np.random.seed(seed=0) 6 7os.environ['PYTHONHASHSEED'] = '0' 8random.seed(0) 9 10session_conf = tf.ConfigProto( 11 intra_op_parallelism_threads=1, 12 inter_op_parallelism_threads=1 13) 14 15tf.set_random_seed(0) 16sess = tf.Session(graph=tf.get_default_graph(), config=session_conf) 17K.set_session(sess) 18 19model = Sequential() 20model.add(Conv2D(32, (3, 3), activation='relu', padding="same", input_shape=(height, width, 3))) 21model.add(Conv2D(32, (3, 3), activation='relu', padding="same")) 22model.add(MaxPooling2D(pool_size=(2, 2))) 23model.add(Dropout(0.25)) 24 25model.add(Conv2D(64, (3, 3), activation='relu', padding="same")) 26model.add(Conv2D(64, (3, 3), activation='relu', padding="same")) 27model.add(MaxPooling2D(pool_size=(2, 2))) 28model.add(Dropout(0.25)) 29 30model.add(Conv2D(128, (3, 3), activation='relu', padding="same")) 31model.add(Conv2D(128, (3, 3), activation='relu', padding="same")) 32model.add(MaxPooling2D(pool_size=(2, 2))) 33model.add(Dropout(0.25)) 34 35model.add(Conv2D(256, (3, 3), activation='relu', padding="same")) 36model.add(Conv2D(256, (3, 3), activation='relu', padding="same")) 37model.add(MaxPooling2D(pool_size=(2, 2))) 38model.add(Dropout(0.25)) 39 40model.add(Conv2D(512, (3, 3), activation='relu', padding="same")) 41model.add(Conv2D(512, (3, 3), activation='relu', padding="same")) 42model.add(MaxPooling2D(pool_size=(2, 2))) 43model.add(Dropout(0.25)) 44 45model.add(Flatten()) 46model.add(Dense(256, activation='relu')) 47model.add(Dropout(0.5)) 48model.add(Dense(1)) 49model.summary() 50 51model.compile(loss='mse', optimizer=Adam(), metrics=['mae']) 52fit = model.fit(imgs_train, labels_train, batch_size, epochs, validation_data=(imgs_test, labels_test))
同じ値を再現したいのであれば、実行環境の OS、各種ライブラリのバージョンなども合わせる必要があるのではないでしょうか。
基本的に機械学習の再現性検証はだいたい同じ精度、結果がでるかどうかで判断すればよいと思います。厳密に同じ値が出ることを期待するのは現実的ではありません。
乱数のシードを固定しているのだから、何回やっても同じ結果になるんじゃないの?という意図の質問ですか?
GPU使ってますよね。そっちじゃないかなぁ。これは見ました?
https://www.bing.com/search?q=cuda+%e7%b5%90%e6%9e%9c%e3%81%8c%e4%b8%8d%e5%ae%89%e5%ae%9a
最新のtensorflowでは修正されているのでしょうか?
https://qiita.com/TokyoMickey/items/63c4053740ab1f3f28a2