質問編集履歴
1
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,3 +1,5 @@
|
|
1
1
|
TransformerのSelf Attentionでは、同じ入力に対しそれぞれの行列をかけquery,key,valueに分けるのですがquery,key,valueをどのようなものにするために学習しているのかが分かりません。
|
2
2
|
|
3
|
+
また、positional encodingされた入力データをどう活用しているかもわかりません。
|
4
|
+
|
3
5
|
よろしくお願いします。
|