質問編集履歴

2021/10/04 00:47

投稿

スコア2

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,3 +1,5 @@
 TransformerのSelf Attentionでは、同じ入力に対しそれぞれの行列をかけquery,key,valueに分けるのですがquery,key,valueをどのようなものにするために学習しているのかが分かりません。
+また、positional encodingされた入力データをどう活用しているかもわかりません。
 よろしくお願いします。