質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

1876閲覧

CIFAR-100データセットの複数クラス抽出について

pontyo

総合スコア13

Chainer

Chainerは、国産の深層学習フレームワークです。あらゆるニューラルネットワークをPythonで柔軟に書くことができ、学習させることが可能。GPUをサポートしており、複数のGPUを用いた学習も直感的に記述できます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/02/04 13:43

編集2020/02/24 11:57

chainerを使用し, 画像認識をしています.
CIFAR-100データセットの一部のクラスを使用して, ネットワークを学習させたいのですが, その方法が分かりません.
どのように修正すれば良いでしょうか.

データ抽出部分のみのコードは以下になります.

python

1 # 抽出するデータラベル 2 mask_list = [4, 30, 55, 72, 95, 1, 32, 67, 73, 91] 3 4 # cifar100を全データ格納 5 old_train, old_test = get_cifar100() 6 7 # 学習用データを抽出 8 count = 0 9 img = None 10 for i in range(len(old_train)): 11 if np.isin(old_train[i][1], mask_list): 12 if count == 0: 13 img = old_train[i][0] 14 label = old_train[i][1] 15 count += 1 16 else: 17 img = np.vstack((img, old_train[i][0])) 18 label = np.hstack((label, old_train[i][1])) 19 20 train = tuple_dataset.TupleDataset(img, label) 21 22 # 評価用データを抽出 23 count = 0 24 img = None 25 for i in range(len(old_test)): 26 if np.isin(old_test[i][1], mask_list): 27 if count == 0: 28 img = old_train[i][0] 29 label = old_train[i][1] 30 count += 1 31 else: 32 img = np.vstack((img, old_test[i][0])) 33 label = np.hstack((label, old_test[i][1])) 34 35 test = tuple_dataset.TupleDataset(img, label)

学習部分も含めたコードは以下になります.

python

1def main(): 2 gane = [64, 64, 128, 128, 256, 256, 256, 512, 512, 512, 512, 512, 512] 3 4 # 抽出するデータラベル 5 mask_list = [4, 30, 55, 72, 95, 1, 32, 67, 73, 91] 6 7 batchsize = 32 8 epoch = 300 9 learnrate = 0.05 10 gpu = 0 11 out = "result" 12 13 print('Using CIFAR100 dataset.') 14 # クラス数を設定 15 class_labels = len(mask_list) 16 # cifar100を全データ格納 17 old_train, old_test = get_cifar100() 18 19 # 学習用データを抽出 20 count = 0 21 img = None 22 for i in range(len(old_train)): 23 if np.isin(old_train[i][1], mask_list): 24 if count == 0: 25 img = old_train[i][0] 26 label = old_train[i][1] 27 count += 1 28 else: 29 img = np.vstack((img, old_train[i][0])) 30 label = np.hstack((label, old_train[i][1])) 31 32 train = tuple_dataset.TupleDataset(img, label) 33 34 # 評価用データを抽出 35 count = 0 36 img = None 37 for i in range(len(old_test)): 38 if np.isin(old_test[i][1], mask_list): 39 if count == 0: 40 img = old_train[i][0] 41 label = old_train[i][1] 42 count += 1 43 else: 44 img = np.vstack((img, old_test[i][0])) 45 label = np.hstack((label, old_test[i][1])) 46 47 test = tuple_dataset.TupleDataset(img, label) 48 49 model = L.Classifier(VGG(gane, class_labels)) 50 51 if gpu >= 0: 52 # Make a specified GPU current 53 chainer.cuda.get_device_from_id(gpu).use() 54 model.to_gpu() # Copy the model to the GPU 55 56 optimizer = chainer.optimizers.MomentumSGD(learnrate) 57 optimizer.setup(model) 58 optimizer.add_hook(chainer.optimizer.WeightDecay(5e-4)) 59 60 train_iter = chainer.iterators.SerialIterator(train, batchsize) 61 test_iter = chainer.iterators.SerialIterator(test, batchsize, 62 repeat=False, shuffle=False) 63 # Set up a trainer 64 updater = training.StandardUpdater(train_iter, optimizer, device=gpu) 65 trainer = training.Trainer(updater, (epoch, 'epoch'), out=out) 66 67 # Evaluate the model with the test dataset for each epoch 68 trainer.extend(extensions.Evaluator(test_iter, model, device=gpu)) 69 70 # Reduce the learning rate by half every 25 epochs. 71 trainer.extend(extensions.ExponentialShift('lr', 0.5), 72 trigger=(25, 'epoch')) 73 74 # Dump a computational graph from 'loss' variable at the first iteration 75 # The "main" refers to the target link of the "main" optimizer. 76 trainer.extend(extensions.dump_graph('main/loss')) 77 78 # Take a snapshot at each epoch 79 trainer.extend(extensions.snapshot(), trigger=(epoch, 'epoch')) 80 81 # Write a log of evaluation statistics for each epoch 82 trainer.extend(extensions.LogReport()) 83 84 trainer.extend(extensions.PrintReport( 85 ['epoch', 'main/loss', 'validation/main/loss', 86 'main/accuracy', 'validation/main/accuracy', 'elapsed_time'])) 87 88 trainer.run() 89 90if __name__ == '__main__': 91 main()

エラー文は以下になります.

--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-4-eb3fae69fa84> in <module>() 224 225 if __name__ == '__main__': --> 226 main() <ipython-input-4-eb3fae69fa84> in main() 145 print(len(label)) 146 print(label.ndim) --> 147 train = tuple_dataset.TupleDataset(img, label) 148 149 count = 0 /usr/local/lib/python3.6/dist-packages/chainer/datasets/tuple_dataset.py in __init__(self, *datasets) 35 if len(dataset) != length: 36 raise ValueError( ---> 37 'dataset of the index {} has a wrong length'.format(i)) 38 self._datasets = datasets 39 self._length = length ValueError: dataset of the index 1 has a wrong length

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Q71

2020/02/23 11:56

エラー文は、これだけでしたか?今あるのは、エラーを起こした部分ですが、ここを呼び出した履歴がついていませんか?
pontyo

2020/02/23 12:10

すみません、エラーの原因だと思われる部分だけ抽出しました。 補足でエラー文全てを貼りました。
Q71

2020/02/23 22:44

これだけ?mainとdatasetの間がない… まぁ、メッセージや、発生行の直上のif文を見ればわかると思いますが、datasetに入っているデータの個数が、なにかの個数と合っていません。その「何か」がわかるかと思ってスタックトレースを追加してもらったのですが。
Q71

2020/02/23 22:49

あ、コードも全部ではないのか。そして肝心なところがない?mainの一部なのか? このやりとりで感じると思いますが、エラーメッセージを読んで、それが何を意図しているのか読み取ることができないと、エラーの内容を相手に伝えるだけで大変です。英語だからと放棄せず、翻訳ソフト・サイトを使ってでもエラーの意味を読み取り、「こういう間違いだろう」という目処はつけてください。
pontyo

2020/02/23 23:11

エラー文は上記のもので全てです。 コードに関してはmain()の中は全て載せています。 importの部分やネットワークの定義部分を省略しているのみです。
pontyo

2020/02/23 23:12

自分でもエラー文の翻訳および検索をしたのですが、原因の目処が立たなかったので質問させていただいた次第です。 申し訳ございません。
pontyo

2020/02/23 23:13

一応エラーを起こしている部分を把握したつもりで最初の投稿はさせていただきました。
Q71

2020/02/24 05:58

そうですか。trainer.run で実行しているところで発生しているのかな。 Pythonをデバッグできる環境があればそれで実行し、エラーが出たら呼び出し履歴を遡って、あるいはそれぞれの数値を表示して、何が違うのか、調べることができます。おそらく、外部で見てもわからないと思います。デバッグして下さい。
Q71

2020/02/24 11:28

label = np.hstack((label, old_train[i][1])) これ、消しているようですが、元々のコードで実行した場合と、変更後のコードで実行した場合で、labelの次元数が変わったりしていませんか?
pontyo

2020/02/24 11:48

どちらも次元数1でした.
pontyo

2020/02/24 11:52

別環境で実行した結果、main()内でエラーを起こしている部分が追記されていました。
pontyo

2020/02/24 11:58

labelを作成する際のコードが学習データ、評価用データで別々だったので統一しておきました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問