質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

0回答

916閲覧

DistilBERTによる文書分類(keras)

n14

総合スコア0

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2021/09/21 08:20

前提・実現したいこと

機械学習の初心者です.Laboroの事前学習済みDistilBERTで2値の文書分類タスクを解こうと思っています.

発生している問題・エラーメッセージ

model.fit()でエラーが発生しました.

ValueError Traceback (most recent call last) <ipython-input-95-23c2a77e679e> in <module>() 6 batch_size=BATCH_SIZE, 7 epochs=EPOCHS, ----> 8 validation_data=(features_val, labels_val)) ValueError: Shape mismatch: The shape of labels (received (4, 1)) should equal the shape of logits except for the last dimension (received (4, 128, 768)).

モデルの出力形状が問題なのでしょうか.

該当のソースコード

features_trainとlabels_trainにはそれぞれ文字列とラベルがエンコードされたリストが入っています.

python

1import os 2import random 3import sys 4import warnings 5import re 6import numpy as np 7import pandas as pd 8import tensorflow as tf 9from tensorflow.keras import losses 10from tensorflow.keras.optimizers import Adam 11from transformers import AlbertTokenizer, TFDistilBertForSequenceClassification, DistilBertConfig 12 13BATCH_SIZE = 4 14EPOCHS = 5 15MAXLEN = 128 16LR = 1e-5 17pretrained_model_name_or_path = 'laboro-ai/distilbert-base-japanese' 18 19model = TFDistilBertForSequenceClassification.from_pretrained(pretrained_model_name_or_path, from_pt=True, num_labels=2) 20optimizer = Adam(learning_rate=3e-5) 21loss = losses.SparseCategoricalCrossentropy(from_logits=True) 22model.compile(optimizer=optimizer, 23 loss=loss, 24 metrics=['accuracy']) 25 26model.fit(x=features_train, 27 y=labels_train, 28 batch_size=BATCH_SIZE, 29 epochs=EPOCHS, 30 validation_data=(features_val, labels_val))

####features_train

{'input_ids': <tf.Tensor: shape=(3754, 128), dtype=int32, numpy= array([[ 2, 6, 22258, ..., 1, 1, 1], [ 2, 6, 19958, ..., 1, 1, 1], [ 2, 6, 1780, ..., 15229, 22485, 3], ..., [ 2, 5676, 11915, ..., 1, 1, 1], [ 2, 5676, 11915, ..., 1, 1, 1], [ 2, 5676, 11915, ..., 1, 1, 1]], dtype=int32)>, 'attention_mask': <tf.Tensor: shape=(3754, 128), dtype=int32, numpy= array([[1, 1, 1, ..., 0, 0, 0], [1, 1, 1, ..., 0, 0, 0], [1, 1, 1, ..., 1, 1, 1], ..., [1, 1, 1, ..., 0, 0, 0], [1, 1, 1, ..., 0, 0, 0], [1, 1, 1, ..., 0, 0, 0]], dtype=int32)>}

#####labels_train

[0 1 0 ... 0 1 0]

試したこと

model.summaryで各層の形状を見たところmultipleとなっていました.

_________________________________________________________________ Layer (type) Output Shape Param _________________________________________________________________ distilbert (TFDistilBertMain multiple 67497984 _________________________________________________________________ pre_classifier (Dense) multiple 590592 _________________________________________________________________ classifier (Dense) multiple 1538 _________________________________________________________________ dropout_119 (Dropout) multiple 0 _________________________________________________________________ Total params: 68,090,114 Trainable params: 68,090,114 Non-trainable params: 0 _________________________________________________________________

補足情報(FW/ツールのバージョンなど)

環境はgoogle colabです. ライブラリのtransformersとsentencepieceは最新のものです.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

jbpb0

2021/10/05 05:53

https://book.mynavi.jp/978store/books/detail/id=121730 の「5.11.4 Laboro版DistilBERTを用いた文書分類」で触れられています kerasではなくpytorchですが、参考になるかもしれないので、紹介しておきます ただし、買って読んでみて、こんなのじゃ参考にならないって思われても、責任取れませんけど
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問