質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

ChatGPT

ChatGPTは、OpenAI社の提供するインタラクティブなテキストコミュニケーションを行うことができるAIサービスまたは、そのアルゴリズムのモデル名です。

Q&A

0回答

1152閲覧

rinnaモデルを自社製品マニュアルでファインチューニング

pochiko

総合スコア4

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

ChatGPT

ChatGPTは、OpenAI社の提供するインタラクティブなテキストコミュニケーションを行うことができるAIサービスまたは、そのアルゴリズムのモデル名です。

0グッド

0クリップ

投稿2023/05/28 07:23

実現したいこと

自社製品のマニュアルの内容を質問応答するAIの開発

前提

rinnaモデルを用いる。

発生している問題・エラーメッセージ

rinnaモデルに自社製品のマニュアルをファインチューニングさせたら、
〇〇に同時接続するのは何台可能ですか?などと聞けば、
「3台です」と答えてくれるような応答システムを作りたいです。
この場合、ファインチューニングするデータは
どのような形式にまとめるのでしょうか?
また、ファインチューニングする際には、汎用モデルではなく下記の対話モデルが適しているでしょうか?
https://huggingface.co/rinna/japanese-gpt-neox-3.6b-instruction-sft

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

PondVillege

2023/05/28 08:00

ファインチューニングにこだわる理由を教えてください.
pochiko

2023/05/28 12:09

ありがとうございます。 ファインチューニングにこだわっているわけではなくて、 上記の希望が叶えば方法は問いません。 他に最適な方法があれば教えて頂きたいです。
PondVillege

2023/05/28 12:50 編集

であればChatGPTのプラグインを利用するのはどうでしょう? マニュアルを参照して適切な応答をする例は既にOpenAIが示しています. https://openai.com/blog/chatgpt-plugins#retrieval リンク下部の動画では2018 年から 2022 年までの国連年次報告書にアクセスしながら応答するプラグインのサンプルが示されています. rinnaモデルを絶対条件にしているなら, ReAct https://arxiv.org/abs/2210.03629 を参考にドキュメント検索するようなプロンプトとシステムを組めばよいはずです.
pochiko

2023/05/28 13:26

ありがとうございます。まさにイメージとしては教えていただいた動画のようなものを描いていました。 たとえば文書管理システムのマニュアルを客先サポートとしてGPTやrinnaを活用して行いたいと思っています。 検索してよく出てくるのがファインチューニングだったのですが ファインチューニングでなくプラグインを提案していただいた理由を もしよければ教えていただけますか? 今後の知識としてぜひお伺いできれば嬉しいです。
PondVillege

2023/05/28 14:22 編集

もしファインチューニングを軸としたマニュアル参照サポートシステムであった場合,マニュアルの更新や新規作成のたびにLLMを学習にかけなくてはなりません.学習のみならずモデルの精度に重大な変化がないかなどの検証も含めると,マニュアル更新のたびに膨大なコストを払うことになります. 対してReActをはじめとするプロンプトエンジニアリングの隆盛は,ファインチューニング等にかける学習へのコストや時間を鑑みた結果になっています.LLMに対してプロンプトを工夫するだけで,欲しい結果を生成させようというものです.ChatGPTプラグインも同様,プロンプトを工夫してあのような結果を得ているにすぎません. さて,プロンプトエンジニアリングで質問のタスクを解決した場合,マニュアル更新/新規作成が生じた際にはこれらLLMが参照する文書データの更新だけで済みます.ここに再学習のコストは存在しません. したがって,ファインチューニングではなく,プロンプトエンジニアリングによる解決を提案しました.
pochiko

2023/05/30 01:32

ありがとうございます。ここ数日ファインチューニングを試してみましたがおっしゃる通り時間もコストもかかり非常に手間だということがわかりました。 プラグインの検討をしてみます。 拙い質問にお答えいただきありがとうございます。 精進してまいります。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問