質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

690閲覧

Transformerのモデル構築ができません(複数のテキストと数値の情報から3値分類したいです)

s.f.

総合スコア1

PyTorch

PyTorchは、オープンソースのPython向けの機械学習ライブラリ。Facebookの人工知能研究グループが開発を主導しています。強力なGPUサポートを備えたテンソル計算、テープベースの自動微分による柔軟なニューラルネットワークの記述が可能です。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2021/10/07 08:59

背景

A社の商品xの売り上げを英語ツイートのテキスト情報を利用して機械学習で予測することを卒論研究で行なっています。
売り上げとツイートを時系列(1d)に分割し、区間番号を割り当てています。
区間[n-k+1,n]のk区間分の情報が与えられたとき、区間(n+1)の売り上げ(sales)がup,stay,downのどれになるかを判定します。

感情分析×SVMによる予測 ←クリア済み

商品xを含むツイートを収集し、感情分析にかけてpos,neu,negの3つに分類
区間ごとにpos,neu,negの数をカウント
SVMの入力:{pos,neu,neg_count(n), sales(n)} × k区間分
SVMの出力:sales(n+1)

Transformerによる予測 ←今ここです

入力:{区間nのすべてのtweet_text、sales(n)} × k区間分
出力:sales(n+1)
となるようなモデルを作りたいです。

実現したいのは、感情分析と予測部分を別々にしていたのを1つのニューラルネットワークに落とし込むことです。
要件は以下の通りです。

・感情分析を使わない
感情分析のライブラリなどは使わず、複数のテキストと売り上げの情報のみから影響が大きい特徴量を学習するような形にしたいです。

・Transformerを使う(PyTorch)
LSTMなどは使わず、比較的新しい技術であるTransformerで実装することを想定しています。
基礎的な知識については、論文この記事を元に学習しました。

質問内容

コーディングというよりは、まずモデルをどのように構築していけばいいかを知りたいです。
分類問題なのでEncoderのみを使うと思うのですが、ある一つのテキストを何かに分類するのではなく、複数のテキストと数値からある一つの分類をするというところのモデルイメージが湧いていない状態です。
データが流れるフローを図などのわかりやすい形で説明して頂けると助かります。
Transformerに詳しい人が身近にいなくて困っています。
よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

自己解決

分類用のEncoderと時系列用のEncoder-Decoderを繋げることで解決しました

投稿2021/10/14 13:35

s.f.

総合スコア1

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問