質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
DataSet

DataSetは、ADO.NETアーキテクチャのコンポーネントです。データベースから取得したレコードをメモリ領域に格納するクラスを指します。データの保持やテーブル間のリレーション・制約といった保持も可能です。

Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

784閲覧

chainerでデータセットのクラス抽出を行いたい

ponpontyo

総合スコア1

DataSet

DataSetは、ADO.NETアーキテクチャのコンポーネントです。データベースから取得したレコードをメモリ領域に格納するクラスを指します。データの保持やテーブル間のリレーション・制約といった保持も可能です。

Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/07/30 09:22

前提・実現したいこと

chainerを使用し, cifar-100データセットのクラス抽出を行い, 新しいデータセットを作成したいです.

発生している問題・エラーメッセージ

クラスの抽出はできていると思うのですが, その後のデータフレーム作成がうまくいきません.
以下エラーコードです.

ValueError Traceback (most recent call last) <ipython-input-10-d3996391b158> in <module>() 235 236 if __name__ == '__main__': --> 237 main() <ipython-input-10-d3996391b158> in main() 156 #print(label.ndim) 157 #print(len(img)) --> 158 train = tuple_dataset.TupleDataset(img, label) 159 160 count = 0 /usr/local/lib/python3.6/dist-packages/chainer/datasets/tuple_dataset.py in __init__(self, *datasets) 35 if len(dataset) != length: 36 raise ValueError( ---> 37 'dataset of the index {} has a wrong length'.format(i)) 38 self._datasets = datasets 39 self._length = length ValueError: dataset of the index 1 has a wrong length

該当のソースコード

データ抽出を行なっている部分のコードです.

python

1 # 抽出するデータラベル 2 mask_list = [4, 30, 55, 72, 95, 1, 32, 67, 73, 91] 3 4 print('Using CIFAR100 dataset.') 5 class_labels = len(mask_list) 6 old_train, old_test = get_cifar100() 7 8 count = 0 9 img = None 10 #label = [] 11 for i in range(len(old_train)): 12 if np.isin(old_train[i][1], mask_list): 13 if count == 0: 14 img = old_train[i][0] 15 label = old_train[i][1] 16 count += 1 17 else: 18 img = np.vstack((img, old_train[i][0])) 19 label = np.hstack((label, old_train[i][1])) 20 #label += old_train[i][1] 21 label = np.array(label) 22 train = tuple_dataset.TupleDataset(img, label)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

問題がある部分はcount==0の

img = old_train[i][0]

から、次のループ以降で

img = np.vstack((img, old_train[i][0]))

とimgに追加している部分です。imgのshapeが(3, 32, 32)となっていますので、この状態で新たにimgに対してnp.vstack()を行うと(6, 32, 32)となってしまいます。本来あるべき動作はcount==0では(0, 3, 32, 32)の状態で、np.vstack()すると(1, 3, 32, 32)となるべきです。

速度のことも考慮すると、以下のようにリストに追加し、最後にnp.array()で型変換するのが良いでしょう。

python

1labels = [] 2imgs = [] 3for img, label in old_train: 4 if np.isin(label, mask_list): 5 labels.append(label) 6 imgs.append(img) 7imgs = np.array(imgs) 8labels = np.array(labels) 9train = tuple_dataset.TupleDataset(imgs, label)

投稿2020/07/30 23:33

yymmt

総合スコア1615

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ponpontyo

2020/07/31 02:17

無事解決しました. 非常にすっきりしたコードで収まっており, 勉強になりました. ありがとうございました.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問