機械学習。検証データでのlossの上昇を解決したい。

機械学習で以下のgithubのhateCLIPperというモデルを動かしたいのですが、適切なデータセットをダウンロードして実行してもバリデーションlossが上昇してしまい、
正しく推論を行う事ができません…
ソースコード自体は何もいじってないのですが、何が原因なのでしょうか？
具体的には、訓練時にはlossが下がり、高い精度を出せているのに、検証データでの推論時の損失が上昇してしまい、過学習のような状態となっています。

このことでずっと詰まってしまったのでこの場を借りて質問させていただきました。

機械学習分野に詳しい方、何かこの問題を解決するアドバイスを教えてほしいです、
よろしくお願いします。

github
https://github.com/gokulkarthik/hateclipper

データセット
https://hatefulmemeschallenge.com

データセットのダウンロードファイル内には
dev_seen
dev_unseen
test_seen
test_unseen
train
がそれぞれあり、検証データ、テストデータ、訓練データとなっております。

退会済みユーザー

2022/12/27 22:40 編集

> 適切なデータセットをダウンロードして実行してもバリデーションlossが上昇してしまい、正しく推論を行う事ができません… 作者に「ソースコード自体は何も触らず手元で検証したけれども"同等の結果が得られない"」とズバリ聞くのが良いように思います。聞いている感じではほぼほぼ過学習だろうと思いますし、これを防ぐために作者は「学習を途中で止めている」可能性もあります。最悪のケースでは作者が「目立つように盛っている」――です。何にせよ、本当のところは作者にしかわかりません。それでも分からなかったら再度質問を修正してはいかがでしょうか？