質問編集履歴
3
誤字
title
CHANGED
|
@@ -1,1 +1,1 @@
|
|
|
1
|
-
CTC lossの
|
|
1
|
+
CTC lossの正解データサイズの疑問
|
body
CHANGED
|
File without changes
|
2
前提の内容の補足
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -12,4 +12,4 @@
|
|
|
12
12
|
|
|
13
13
|
ドキュメントを参照したところ、CTC lossに適切な正解データサイズは[バッチ数,シーケンス長]の2次元とのことです。また予測値は最後にLogSoftmaxを通した値にする必要がする必要があるようです。Softmaxを使うということは、正解データはone_hotベクトルで表現し、[バッチ数,シーケンス長,クラス数(one_hot)]の3次元になると思います。今の私の認識ですと、正解データのサイズに関し矛盾が生じることになります。どこに誤りがあるのかご指摘頂けますと大変ありがたく存じます。
|
|
14
14
|
|
|
15
|
-
素人質問で
|
|
15
|
+
素人質問ではありますが、ご回答頂けますと幸いです。よろしくお願い致します。
|
1
前提の内容の補足
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
### 前提
|
|
2
2
|
|
|
3
|
-
Pythonで、入力と出力のシーケンス長が異なるデータを扱うモデルを構築しようと考えています。Pytorchでの実装をしようとしているのですが、損失関数のCTC lossに関してご質問があります。なおTensorFlowでも同様の仕様でしたのでタグに加えさせて頂きました。
|
|
3
|
+
Pythonで、入力(画像)と出力(文字列)のシーケンス長が異なるデータを扱うニューラルネットワークモデルを構築しようと考えています。Pytorchでの実装をしようとしているのですが、損失関数のCTC lossに関してご質問があります。なおTensorFlowでも同様の仕様でしたのでタグに加えさせて頂きました。
|
|
4
4
|
|
|
5
5
|
PytorchのCTC loss文書:
|
|
6
6
|
https://pytorch.org/docs/stable/generated/torch.nn.CTCLoss.html
|