前提
joeyNMTで機械翻訳を勉強中の初心者です。
実行途中に、ハイパーパラメータを変えてもう一度学習しなおそうと思い、Ctrl+Cののち、作られたckptファイルを削除して再度学習させようとしたところ、エラーが発生しました。
実現したいこと
下記のエラーメッセージから、ckptファイルがなく、チェックポイントを読み込めないでいるのが問題なのだと思います。
新たにckptファイルを作成するか、ckptファイルのない一番最初の状態(joeyNMTをインストールした状態)に戻して実行できるようにしたいです。
発生している問題・エラーメッセージ
File "/home/utagawa/anaconda3/envs/utagawa/lib/python3.8/runpy.py", line 192, in _run_module_as_main return _run_code(code, main_globals, None, File "/home/utagawa/anaconda3/envs/utagawa/lib/python3.8/runpy.py", line 85, in _run_code exec(code, run_globals) File "/net/nas4/data/home/utagawa/joeynmt/joeynmt/__main__.py", line 64, in <module> main() File "/net/nas4/data/home/utagawa/joeynmt/joeynmt/__main__.py", line 44, in main train(cfg_file=args.config_path, skip_test=args.skip_test) File "/net/nas4/data/home/utagawa/joeynmt/joeynmt/training.py", line 844, in train test( File "/net/nas4/data/home/utagawa/joeynmt/joeynmt/prediction.py", line 384, in test model_checkpoint = load_checkpoint(ckpt, device=device) File "/net/nas4/data/home/utagawa/joeynmt/joeynmt/helpers.py", line 472, in load_checkpoint assert path.is_file(), f"Checkpoint {path} not found." AssertionError: Checkpoint /net/nas4/data/home/utagawa/joeynmt/models/tanaka_corpus/0.ckpt not found.
該当のソースコード
def load_checkpoint(path: Path, device: torch.device) -> Dict: """ Load model from saved checkpoint. :param path: path to checkpoint :param device: cuda device name or cpu :return: checkpoint (dict) """ logger = logging.getLogger(__name__) assert path.is_file(), f"Checkpoint {path} not found." checkpoint = torch.load(path.as_posix(), map_location=device) logger.info("Load model from %s.", path.resolve()) return checkpoint def resolve_ckpt_path(ckpt: str, load_model: str, model_dir: Path) -> Path: """ Resolve checkpoint path :param ckpt: str passed from stdin args (--ckpt) :param load_model: config entry (cfg['training']['load_model']) :param model_dir: Path(cfg['training']['model_dir']) :return: resolved checkpoint path """ if ckpt is None: if load_model is None: if (model_dir / "best.ckpt").is_file(): ckpt = model_dir / "best.ckpt" else: ckpt = get_latest_checkpoint(model_dir) else: ckpt = Path(load_model) return Path(ckpt)
試したこと
path.is_file()で判断しているので新たに作ればよいと思い、0.ckptという空ファイルを作成して実行したところ、同様のエラーが出ました。

回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。