質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Neural Network Console

Neural Network Consoleは、ソニー社が開発したディープラーニング・ツール。ニューラルネットワークを視覚的に設計することが可能で、学習や評価をスムーズに実現できます。また、ニューラルネットワークを自動的に構築する機能も備わっています。

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

AWS Glue

AWS Glueは、分析のためのデータの抽出や変換、ロードを簡単にするフルマネージド型のサービスです。データ処理の自動化の他、データ収集やETL処理も自動化・サーバレス化することが可能。AWSに保存したデータを指定すると、AWS Glueでデータ検索することもできます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

857閲覧

テキスト分類の流れを理解したいです。

smart-material

総合スコア12

Neural Network Console

Neural Network Consoleは、ソニー社が開発したディープラーニング・ツール。ニューラルネットワークを視覚的に設計することが可能で、学習や評価をスムーズに実現できます。また、ニューラルネットワークを自動的に構築する機能も備わっています。

Google Colaboratory

Google Colaboratoryとは、無償のJupyterノートブック環境。教育や研究機関の機械学習の普及のためのGoogleの研究プロジェクトです。PythonやNumpyといった機械学習で要する大方の環境がすでに構築されており、コードの記述・実行、解析の保存・共有などが可能です。

AWS Glue

AWS Glueは、分析のためのデータの抽出や変換、ロードを簡単にするフルマネージド型のサービスです。データ処理の自動化の他、データ収集やETL処理も自動化・サーバレス化することが可能。AWSに保存したデータを指定すると、AWS Glueでデータ検索することもできます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/11/12 07:27

編集2021/11/12 09:20

テキスト分類や二値分類に関する勉強をしていると疑問に思うことがありました。

https://arxiv.org/pdf/1805.12471.pdf

この論文の中で紹介されている、Colaに関しての模式図が下記になります。
この画像で、(w)に単語が埋め込まれのことはわかったのですが、(f)と(b)はどのような働きをするのか。また、(0,1)と判断されるまでの流れを教えていただきたいです。
イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TakaiY

2021/11/12 08:34

質問は何ですか?
smart-material

2021/11/12 08:53

上記の画像で、(w)に単語が埋め込まれのことはわかったのですが、(f)と(b)はどのような働きをするのか。また、(0,1)と判断されるまでの流れを教えていただきたいです。
TakaiY

2021/11/12 09:09

回答はここに書くのでなく、質問を編集して内容を修正しましょう。 見てくれた人に伝わりやすくなります。
guest

回答1

0

ベストアンサー

4.2のBaselineに大体のことが書いてあります。

要約すると、

  • CoLAは2つの構造がある。

A:Encoderと呼ばれるLSTMによって適当な長さに埋め込み(embeddings)を行う部分
B:Classifierと呼ばれる埋め込みの結果をもとに、軽量なクラス分けを行う部分

  • A:については、エンコーダでは順方向の隠れ層(f)逆方向の隠れ層(b) があり、それぞれの結果が結合されてツラツラと繋がった言葉の特徴ができあがり、それをMaxpoolingしてEmbeddingsを構成する。
  • B:については、sigmoidによってEmbeddingsを0-1の確率分布に変換する。

Embeddingsを使って○○か判定、は画像認識でもよくある手法です。
ですので、この例は

  • 文章をハンドリングしやすくするために、画像認識でも使うような手法を使えるようにする(確率の計算ができるようにお膳立てする)方法としてLSTMを使ったよ。
  • 結果、画像をベクトル化(Embeddingsに変換)して表現するように、文章もベクトル化(Embeddingsに変換)できたよ。
  • だから画像認識で画像を確率で表現(Sigmoidで変換)するように、CoLAでも文章を確率で表現(Sigmoidで変換)できるようになったよ。
  • ね、だから偽物っぽいか本物っぽいか評価できるよね?

と考えるとすんなりいくと思います。

投稿2021/11/12 21:32

編集2021/11/12 21:40
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

smart-material

2021/11/15 07:14

大変わかりやすいご説明ありがとうございます。 追加の質問になってしまうのですが、この論文で紹介されているプログラムのコードが見当たらないため、実行したくてもできません。こういった際には、データセットのダウンロード先は見つかったのですがコードなどは自分で作るしかないのでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問