機械学習で以下のgithubのhateCLIPperというモデルを動かしたいのですが、適切なデータセットをダウンロードして実行してもバリデーションlossが上昇してしまい、
正しく推論を行う事ができません…
ソースコード自体は何もいじってないのですが、何が原因なのでしょうか?
具体的には、訓練時にはlossが下がり、高い精度を出せているのに、検証データでの推論時の損失が上昇してしまい、過学習のような状態となっています。
このことでずっと詰まってしまったのでこの場を借りて質問させていただきました。
機械学習分野に詳しい方、何かこの問題を解決するアドバイスを教えてほしいです、
よろしくお願いします。
github
https://github.com/gokulkarthik/hateclipper
データセット
https://hatefulmemeschallenge.com
データセットのダウンロードファイル内には
dev_seen
dev_unseen
test_seen
test_unseen
train
がそれぞれあり、検証データ、テストデータ、訓練データとなっております。
あなたの回答
tips
プレビュー