質問するログイン新規登録

質問編集履歴

3

誤字

2022/10/22 11:03

投稿

Kamaboko
Kamaboko

スコア1

title CHANGED
@@ -1,1 +1,1 @@
1
- CTC lossの扱いについて
1
+ CTC lossの正解データサイズの疑問
body CHANGED
File without changes

2

前提の内容の補足

2022/10/21 13:24

投稿

Kamaboko
Kamaboko

スコア1

title CHANGED
File without changes
body CHANGED
@@ -12,4 +12,4 @@
12
12
 
13
13
  ドキュメントを参照したところ、CTC lossに適切な正解データサイズは[バッチ数,シーケンス長]の2次元とのことです。また予測値は最後にLogSoftmaxを通した値にする必要がする必要があるようです。Softmaxを使うということは、正解データはone_hotベクトルで表現し、[バッチ数,シーケンス長,クラス数(one_hot)]の3次元になると思います。今の私の認識ですと、正解データのサイズに関し矛盾が生じることになります。どこに誤りがあるのかご指摘頂けますと大変ありがたく存じます。
14
14
 
15
- 素人質問で申し訳ありませんが、ご回答頂けますと幸いです。よろしくお願い致します。
15
+ 素人質問でありまが、ご回答頂けますと幸いです。よろしくお願い致します。

1

前提の内容の補足

2022/10/21 13:24

投稿

Kamaboko
Kamaboko

スコア1

title CHANGED
File without changes
body CHANGED
@@ -1,6 +1,6 @@
1
1
  ### 前提
2
2
 
3
- Pythonで、入力と出力のシーケンス長が異なるデータを扱うモデルを構築しようと考えています。Pytorchでの実装をしようとしているのですが、損失関数のCTC lossに関してご質問があります。なおTensorFlowでも同様の仕様でしたのでタグに加えさせて頂きました。
3
+ Pythonで、入力(画像)と出力(文字列)のシーケンス長が異なるデータを扱うニューラルネットワークモデルを構築しようと考えています。Pytorchでの実装をしようとしているのですが、損失関数のCTC lossに関してご質問があります。なおTensorFlowでも同様の仕様でしたのでタグに加えさせて頂きました。
4
4
 
5
5
  PytorchのCTC loss文書:
6
6
  https://pytorch.org/docs/stable/generated/torch.nn.CTCLoss.html