質問編集履歴

試したことの追記

2022/03/14 14:14

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -197,6 +197,10 @@
 GitHubで公開されているコードをそのまま実行しても同じエラーになりました。
 https://github.com/yamaru12345/nlp100/blob/master/chapter09_89.ipynb
+```
+TypeError: dropout(): argument 'input' (position 1) must be Tensor, not str
+```
 ### 補足情報（FW/ツールのバージョンなど）
 Python 3.7
 simpletransformers-0.63.4-py3-none-any.whl

試したことの追記

2022/03/14 14:13

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -193,6 +193,10 @@
 labels: tensor([1., 0., 0., 0.])
 ```
+#### 質問いただいた内容
+GitHubで公開されているコードをそのまま実行しても同じエラーになりました。
+https://github.com/yamaru12345/nlp100/blob/master/chapter09_89.ipynb
 ### 補足情報（FW/ツールのバージョンなど）
 Python 3.7
 simpletransformers-0.63.4-py3-none-any.whl

試したことの補足

2022/03/12 13:46

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -171,6 +171,22 @@
 [記事の出力](https://qiita.com/yamaru/items/63a342c844cff056a549#%E5%AD%A6%E7%BF%92%E3%81%AE%E6%BA%96%E5%82%99)にあるように、Tensorへ変換できていることは確認済みです。
 ```
+# 正解ラベルのone-hot化
+y_train = pd.get_dummies(train, columns=['CATEGORY'])[['CATEGORY_b', 'CATEGORY_e', 'CATEGORY_t', 'CATEGORY_m']].values
+y_valid = pd.get_dummies(valid, columns=['CATEGORY'])[['CATEGORY_b', 'CATEGORY_e', 'CATEGORY_t', 'CATEGORY_m']].values
+y_test = pd.get_dummies(test, columns=['CATEGORY'])[['CATEGORY_b', 'CATEGORY_e', 'CATEGORY_t', 'CATEGORY_m']].values
+# Datasetの作成
+max_len = 20
+tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
+dataset_train = CreateDataset(train['TITLE'], y_train, tokenizer, max_len)
+dataset_valid = CreateDataset(valid['TITLE'], y_valid, tokenizer, max_len)
+dataset_test = CreateDataset(test['TITLE'], y_test, tokenizer, max_len)
+for var in dataset_train[0]:
+  print(f'{var}: {dataset_train[0][var]}')
+#出力
 ids: tensor([  101, 25416,  9463,  1011, 10651,  1015,  1011,  2647,  2482,  4341,
          2039,  2005,  4369,  3204,  2004, 18730,  8980,   102,     0,     0])
 mask: tensor([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0])

データについて言及

2022/03/12 13:43

投稿

スコア0

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -3,7 +3,7 @@
 ### 前提・実現したいこと
 「[【PyTorch】BERTを用いた文書分類入門](https://qiita.com/yamaru/items/63a342c844cff056a549#%E3%81%AF%E3%81%98%E3%82%81%E3%81%AB)」という記事を参考に、事前学習済みBERTモデルをファインチューニングしようとしています。
-Google Colaboratoryを使い、「ランタイムのタイプ」は「GPU」にしています。
+データセットや前処理は全て記事の通りに行い、Google Colaboratoryを使い、「ランタイムのタイプ」は「GPU」にしています。
 ### 発生している問題・エラーメッセージ
 記事では特に言及されていなかったのですが、モデルの学習時の入力の型に問題があるようで、実行することができません。