BERTで自然言語処理を勉強している初心者です。https://github.com/yoheikikuta/bert-japanese/blob/master/notebook/finetune-to-livedoor-corpus.ipynb
を参考に勉強しております。
Python
FILEURL = config['FINETUNING-DATA']['FILEURL']
FILEPATH = config['FINETUNING-DATA']['FILEPATH']
EXTRACTDIR = config['FINETUNING-DATA']['TEXTDIR']
Dataset is livedoor ニュースコーパス in https://www.rondhuit.com/download.html. We make test:dev:train = 2:2:6 datasets.とあり、データはlivedoorのニュースコーパスから取得するようですが、具体的にどのようにデータ取得すれば良いのかがわかりません。初歩的なことかもしれませんが、どなたか教えていただければ大変助かります。
あなたの回答
tips
プレビュー