質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.32%
C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

LLM

LLM(大規模言語モデル)は、膨大なデータセットとディープラーニング技術により構築された言語モデル。データ量・計算量・パラメータ量の3つの要素が従来の言語モデルよりも大幅に強化され、より高精度な言語処理が可能です。

Q&A

解決済

1回答

370閲覧

参照実装についてよくわからない

salmonyukke

総合スコア6

C++

C++はC言語をもとにしてつくられた最もよく使われるマルチパラダイムプログラミング言語の1つです。オブジェクト指向、ジェネリック、命令型など広く対応しており、多目的に使用されています。

LLM

LLM(大規模言語モデル)は、膨大なデータセットとディープラーニング技術により構築された言語モデル。データ量・計算量・パラメータ量の3つの要素が従来の言語モデルよりも大幅に強化され、より高精度な言語処理が可能です。

0グッド

0クリップ

投稿2024/11/25 16:48

実現したいこと

タイトルにもある通り、今の自分がやっている実装において参照実装がどれなのかを知りたいです。

前提

llama.cppを使用して、llama2-7b-chat.Q4_K_M.ggufを動かしています。
llama.cppが実装部分で、llama2-7b~がモデルであることはわかります。
ただ、このとき、参照実装が何かを説明しろと問われたときに詰まってしまいます。

Transformerなのでしょうか?または違った類のものなのでしょうか?
教えていただけると幸いです。
よろしくお願いします。

発生している問題・エラーメッセージ

エラーメッセージ

該当のソースコード

ソースコード

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

toge_

2024/11/26 18:34

あまり詳しい経緯までは把握していないので、コメントとして回答しておきます。 llama.cppは本来はLLaMAモデルの推論を軽量に動かすためのもので、LLaMAモデルはTransformerに基づいているので、「llama.cppはTransformerの推論部分を実装したもの」というのが無難な回答に思います。 「論文で記載されたことを実装したもの」という意味で「参照実装」を使うのならば、対応する論文はTransfomerの論文ではなくLLaMAの論文になってしまうと思います。
salmonyukke

2024/11/27 13:36 編集

回答ありがとうございます。
toge_

2024/11/27 18:18

何かしらご参考になったのならば何よりです。
guest

回答1

0

自己解決

Llama2はTransformerを参照実装した、のではなくただ機能を拡張させたもの。

Llama2の参照実装として考えられるのは、Llama2に関する論文?

投稿2024/11/27 13:37

salmonyukke

総合スコア6

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.32%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問