前提・実現したいこと
列のどこかに、数字じゃなきゃいけないのに、文字列が入っています。。
それの、見つけ方をどなかた優秀なかたがいましたら、やり方を共有してもらえると幸いです。
1枚目だと、エラーがでないで、2枚目だと、エラーが出ない。
発生している問題・エラーメッセージ
traintraintrain--------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-85-4a4de24907bb> in <module> 4 print(f'FOLD: {fold}') 5 print('-'*50) ----> 6 run(, fold) <ipython-input-82-b49272d4ce84> in run(data, fold) 2 args = Config() 3 model, model_config, tokenizer, optimizer, scheduler, train_dataloader, \ ----> 4 valid_dataloader, result_dict = init_training(args, data, fold) 5 6 trainer = Trainer(model, tokenizer, optimizer, scheduler) <ipython-input-81-d7f5e53d125d> in init_training(args, data, fold) 17 18 # data loaders ---> 19 _dataloader, valid_dataloader = make_loader(args, data, tokenizer, fold) 20 21 # optimizer <ipython-input-78-daed5db03d79> in make_loader(args, data, tokenizer, fold) 55 train_features, valid_features = [[] for _ in range(2)] 56 for i, row in train_set.iterrows(): ---> 57 _features += prepare_train_features(args, row, tokenizer) 58 for i, row in valid_set.iterrows(): 59 valid_features += prepare_train_features(args, row, tokenizer) <ipython-input-72-03ad6972eb22> in prepare_train_features(args, example, tokenizer) 35 answers = example["answers"] 36 ---> 37 if len(answers["answer_start"]) == 0: 38 feature["start_position"] = cls_index 39 feature["end_position"] = cls_index TypeError: string indices must be integers
該当のソースコード
train = pd.read_csv('../input/squad-ta-hi-190k/squad_ta_hi.csv',index_col = 0) train [](https://www.kaggle.com/rhtsingh/chaii-qa-5-fold-xlmroberta-torch-fit)
試したこと
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
Python3 (3.7.4)
Jupyter Lab version 1.1.4
macbookpro 16
回答1件
あなたの回答
tips
プレビュー