質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.34%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

1479閲覧

機械学習でのchatbotの実装(BERT)

退会済みユーザー

退会済みユーザー

総合スコア0

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

1クリップ

投稿2021/11/19 06:04

こちらのサイトを参考にchatbotを実装し学習を行ったのですが, なぜか返答が「おはようございます」だけになってしまいます.コードのどこかを変更すればうまく行くようですが, config.py やmain.py loss.pyなどどのコードを見ても変更点がわかりません
どなたか教えていただけないでしょうか

main.py

python

1 import logging 2import os 3import pickle 4 5import torch 6import torch.nn as nn 7import torch.optim as optim 8 9from config import Config 10from nn import build_model 11from tokenizer import Tokenizer 12from utils import (DialogDataset, one_cycle, evaluate, 13 seed_everything, BalancedDataLoader, 14 make_train_data_from_txt, make_itf) 15 16logging.basicConfig(level=logging.INFO) 17 18if __name__ == '__main__': 19 logging.info('*** Initializing ***') 20 21 if not os.path.isdir(Config.data_dir): 22 os.mkdir(Config.data_dir) 23 24 seed_everything(Config.seed) 25 device = torch.device(Config.device) 26 27 start_epoch = 0 28 tokenizer = Tokenizer.from_pretrained(Config.model_name) 29 30 logging.info('Preparing training data') 31 if Config.use_pickle: 32 with open(f'{Config.pickle_path}', 'rb') as f: 33 train_data = pickle.load(f) 34 else: 35 train_data = make_train_data_from_txt(Config, tokenizer) 36 itf = make_itf(train_data, Config.vocab_size) 37 dataset = DialogDataset(train_data, tokenizer) 38 39 logging.info('Define Models') 40 model = build_model(Config).to(device) 41 model.unfreeze() 42 43 logging.info('Define Loss and Optimizer') 44 criterion = nn.CrossEntropyLoss(reduction='none') 45 optimizer = optim.AdamW(model.parameters(), lr=Config.lr, betas=Config.betas, eps=1e-9) 46 47 if Config.load: 48 state_dict = torch.load(f'{Config.data_dir}/{Config.fn}.pth') 49 start_epoch = 10 50 print(f'Start Epoch: {start_epoch}') 51 model.load_state_dict(state_dict['model']) 52 optimizer.load_state_dict(state_dict['opt']) 53 54 logging.info('Start Training') 55 for epoch in range(start_epoch, Config.n_epoch): 56 one_cycle(epoch, Config, model, optimizer, criterion, 57 BalancedDataLoader(dataset, tokenizer.pad_token_id), 58 tokenizer, device) 59 evaluate(Config, 'おはよーーー', tokenizer, model, device)

config.py

class Config: seed = 116 device = 'cuda' n_epoch = 10 batch_size = 64 max_len = 22 lr = 1e-3 betas = (0.9, 0.98) vocab_size = 32000 num_head = 8 d_model = 768 num_layer = 6 d_ff = 2048 drop_rate = 0.1 max_grad_norm = 1.0 smoothing = 0.1 factor = 2 warmup = 4000 # FIXME: Change path of training data. data_dir = './data' # in config.py, line 24 # default value is './data' # data_dir = 'path/to/dir_contains_training_data' train_data_path = f'{data_dir}/train_data.txt' pickle_path = f'{data_dir}/train_data.pkl' fn = 'ckpt' load = False # FIXME: if you use original data, change flag of this use_pickle = True model_name = 'bert-base-japanese-whole-word-masking'

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/11/19 23:41

データに問題がるのか、コードに問題があるのか探るところから始めた方が良いと思います。 元のコードのまま走らせたときには引用元と同じように動いたのでしょうか?
退会済みユーザー

退会済みユーザー

2021/11/22 04:13

正常に動きました 応答だけが一辺倒になります また, 同様のコードを走らせた方がソースコードのどこかを変更するとうまくいったとおっしゃっていました.しかしながら変更点は忘れてしまったようで, 苦戦しています
guest

回答1

0

ベストアンサー

config.pyを調整することで解決しました

投稿2021/12/09 04:39

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takota

2022/07/11 02:44

失礼します。私も↑のサイトを参考にしており、全く同じ症状で悩んでいるのですが、config.pyをどのように調整したのか教えていただけますでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.34%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問