質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
CNN (Convolutional Neural Network)

CNN (Convolutional Neural Network)は、全結合層のみではなく畳み込み層とプーリング層で構成されるニューラルネットワークです。画像認識において優れた性能を持ち、畳み込みニューラルネットワークとも呼ばれています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

Python ValueError: Data cardinality is ambiguous: エラーの改善

odenhanpen
odenhanpen

総合スコア5

CNN (Convolutional Neural Network)

CNN (Convolutional Neural Network)は、全結合層のみではなく畳み込み層とプーリング層で構成されるニューラルネットワークです。画像認識において優れた性能を持ち、畳み込みニューラルネットワークとも呼ばれています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

-1評価

0クリップ

648閲覧

投稿2021/12/16 07:36

編集2021/12/17 08:26

前提・実現したいこと

PythonでCNNモデルを用い音声感情分類を行うシステムを作っています。
以下のエラーメッセージが発生しました。xとyのサイズを揃えないといけないと思うのですが、
どう修正すれば良いか調べてみても分からなかったため、どなたかご教授いただけませんでしょうか?

発生している問題・エラーメッセージ

(637, 2913, 40, 1) (762, 4) (450, 2913, 40, 1) (450, 4) Traceback (most recent call last): File "cnn_model.py", line 329, in <module> main() File "cnn_model.py", line 286, in main callbacks=[valid_metrics, chkPoint] File "/usr/local/lib/python3.7/dist-packages/keras/utils/traceback_utils.py", line 67, in error_handler raise e.with_traceback(filtered_tb) from None File "/usr/local/lib/python3.7/dist-packages/keras/engine/data_adapter.py", line 1657, in _check_data_cardinality raise ValueError(msg) ValueError: Data cardinality is ambiguous: x sizes: 637 y sizes: 762 Make sure all arrays contain the same number of samples.

該当のソースコード

Python

f_train_path = os.getcwd() + '/feature/Session' + fold + '/train/' def hard_label(path): label=[] f_list = list(ii for ii in sorted(glob.glob(path))) for file_path in f_list: with open(file_path, 'r') as file: for line in file: line_sp = line.replace('Happiness', '0') line_sp = line_sp.replace('Anger', '1') line_sp = line_sp.replace('Neutral', '2') line_sp = line_sp.replace('Sadness', '3') line_sp = line_sp.replace('\n', '') line_sp = line_sp.split(',') if (len(line_sp)==10): if (line_sp[9] == '0') or (line_sp[9] == '1') or (line_sp[9] == '2') or (line_sp[9] == '3'): label.append(line_sp[9]) print(line_sp[0]) file.close() label = np.array(label) label = label.astype('int16') #print(label) return label def load_data(path): f_list = list(sorted(glob.glob(path + '*.npy'))) X = np.zeros((len(f_list), slen, f_dim), dtype='float32') for fname, ii in zip(f_list, range(len(f_list))): tmp = np.load(fname) padd = np.zeros((slen-len(tmp), f_dim)) X[ii] = np.vstack((tmp, padd)) return X.reshape(len(X), slen, f_dim, 1) print(x_train.shape, y_train.shape) print(x_test.shape, y_test.shape) # Trains the model for a fixed number of epochs (iterations on a dataset) model_history = model.fit(x=x_train, y=y_train, batch_size=batch_size, epochs=epochs, #class_weight=class_weight, verbose=0, validation_data=(x_test, y_test), callbacks=[valid_metrics, chkPoint] ) def main(): x_train = load_data(f_train_path)

補足情報(FW/ツールのバージョンなど)

Google Colabratory
Python 3.6.5

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

jbpb0

2021/12/16 11:22

> (637, 2913, 40, 1) (762, 4) x_trainのサンプル数が637で、y_trainのサンプル数が762で、それが違うからエラーが出てるのだと思います x_trainは「x_train = load_data(f_train_path)」で作っていて、「def load_data(path):」を見ると、指定したディレクトリパス「f_train_path = os.getcwd() + '/feature/Session' + fold + '/train/'」にある、名前が「*.npy」のファイルの数がサンプル数のようです y_trainのサンプル数は、それを作ってるところのコードが質問に記載されて無いので分かりません
odenhanpen

2021/12/17 07:47

ご回答ありがとうございます。 def main(): x_train = load_data(f_train_path) y_train = hard_label(l_train_path) Happiness=np.count_nonzero(y_train==0) Anger=np.count_nonzero(y_train==1) Neutral=np.count_nonzero(y_train==2) Sadness=np.count_nonzero(y_train==3) n_max=max(Happiness, Anger, Neutral, Sadness) y_train = to_categorical(y_train, emo_classes) この部分でしょうか?
jbpb0

2021/12/17 08:15

> y_train = hard_label(l_train_path) の「hard_label()」の定義です 「def hard_label(path):」みたいなのの中身
odenhanpen

2021/12/17 08:17

失礼いたしました。こちらです。CSVファイルの中にデータベースのラベル情報が入っています。9列目に取得したいラベルが記載されています。 def hard_label(path): label=[] f_list = list(ii for ii in sorted(glob.glob(path))) for file_path in f_list: with open(file_path, 'r') as file: for line in file: line_sp = line.replace('Happiness', '0') line_sp = line_sp.replace('Anger', '1') line_sp = line_sp.replace('Neutral', '2') line_sp = line_sp.replace('Sadness', '3') line_sp = line_sp.replace('\n', '') line_sp = line_sp.split(',') if (len(line_sp)==10): if (line_sp[9] == '0') or (line_sp[9] == '1') or (line_sp[9] == '2') or (line_sp[9] == '3'): label.append(line_sp[9]) print(line_sp[0]) file.close() label = np.array(label) label = label.astype('int16') return label
jbpb0

2021/12/17 08:23

まず、ディレクトリパス「f_train_path = os.getcwd() + '/feature/Session' + fold + '/train/'」にある、名前が「*.npy」のファイルの数を数えてください おそらく637個で、それがx_trainのサンプル数です
jbpb0

2021/12/17 08:24

「def hard_label(path):」は、質問を編集して追記してください ここに書かれても、インデントが消えてしまい、よく分かりません
jbpb0

2021/12/17 08:35

> CSVファイルの中にデータベースのラベル情報が入っています。9列目に取得したいラベルが記載されています。 ディレクトリパス「l_train_path」にある全てのファイルで、ラベルが記載されてる行の数を数えてください おそらく762行で、それがy_trainのサンプル数です
jbpb0

2021/12/17 08:39

・x_trainのサンプル数は、「f_train_path」にある、名前が「*.npy」のファイルの数 ・y_trainのサンプル数は、「l_train_path」にある、全(CSV?)ファイルに書かれてるラベルの総数 で、両者が一致してないのがまずいのだと思います そもそものデータの作り方が間違ってないか、確認してみてください
odenhanpen

2021/12/18 07:04

なるほど、ありがとうございます。確認してみます。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

CNN (Convolutional Neural Network)

CNN (Convolutional Neural Network)は、全結合層のみではなく畳み込み層とプーリング層で構成されるニューラルネットワークです。画像認識において優れた性能を持ち、畳み込みニューラルネットワークとも呼ばれています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。