テキスト分類の流れを理解したいです。

テキスト分類や二値分類に関する勉強をしていると疑問に思うことがありました。

https://arxiv.org/pdf/1805.12471.pdf
この論文の中で紹介されている、Colaに関しての模式図が下記になります。
この画像で、(w)に単語が埋め込まれのことはわかったのですが、(f)と(b)はどのような働きをするのか。また、(０,1)と判断されるまでの流れを教えていただきたいです。

TakaiY

2021/11/12 08:34

質問は何ですか？

smart-material

2021/11/12 08:53

上記の画像で、(w)に単語が埋め込まれのことはわかったのですが、(f)と(b)はどのような働きをするのか。また、(０,1)と判断されるまでの流れを教えていただきたいです。

TakaiY

2021/11/12 09:09

回答はここに書くのでなく、質問を編集して内容を修正しましょう。見てくれた人に伝わりやすくなります。

行動規範の内容に同意します

回答1件

ベストアンサー

4.2のBaselineに大体のことが書いてあります。

要約すると、

CoLAは2つの構造がある。
A:Encoderと呼ばれるLSTMによって適当な長さに埋め込み(embeddings)を行う部分
B:Classifierと呼ばれる埋め込みの結果をもとに、軽量なクラス分けを行う部分
A:については、エンコーダでは順方向の隠れ層(f)と逆方向の隠れ層(b) があり、それぞれの結果が結合されてツラツラと繋がった言葉の特徴ができあがり、それをMaxpoolingしてEmbeddingsを構成する。
B:については、sigmoidによってEmbeddingsを0-1の確率分布に変換する。