質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
多次元配列

1次元配列内にさらに配列を格納している配列を、多次元配列と呼びます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。

Q&A

解決済

1回答

3227閲覧

ImageDataGeneratorで作成したデータの配列をnumpy形式にしたい

r.k1991

総合スコア2

多次元配列

1次元配列内にさらに配列を格納している配列を、多次元配列と呼びます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。

0グッド

0クリップ

投稿2020/10/17 12:49

編集2020/10/17 14:59

image data generatorを利用してデータ拡張を実施しています。
その出力したデータをnumpy形式に保存したいと思って以下のコードを記載しました。
以下で保存した場合、5次元配列(15000,1,28,28,1)=(要素数、元のnumpyファイルのバッチ数、縦ピクセル、横ピクセル、チャネル数)になってしまいます。
これを15000,28,28,1の4次元配列で保存させたいのですが、方法ございますでしょうか?

Python

1def onehot_to_str(label): 2 """ 3 ワンホットベクトル形式のラベルをカタカナ文字に変換する 4 """ 5 dic_katakana = {"a":0,"i":1,"u":2,"e":3,"o":4,"ka":5,"ki":6,"ku":7,"ke":8,"ko":9,"sa":10,"si":11,"su":12,"se":13,"so":14} 6 label_int = np.argmax(label) 7 for key, value in dic_katakana.items(): 8 if value==label_int: 9 return key 10X=[] 11y=[] 12data = np.load("../1_data/katakana/ImageDataGenerator/original/train_data.npy") 13for i in range(len(data)): 14 # 画像読み込み 15 data = np.load("../1_data/katakana/ImageDataGenerator/original/train_data.npy") # パスは適宜変更すること 16 label = np.load("../1_data/katakana/ImageDataGenerator/original/train_label.npy") # パス 17 data = data[i:i+1] 18 label = label[i:i+1] 19 label_katakana = onehot_to_str(label) 20 21 # 軸をN,H,W,Cに入れ替え 22 data = data.transpose(0,2,3,1) 23 24 # ImageDataGeneratorのオブジェクト生成 25 datagen = ImageDataGenerator( 26 rescale=1./255, 27 width_shift_range=0.2, 28 height_shift_range=0.2, 29 zoom_range = 0.1, 30 shear_range = 0.2, 31 ) 32 33 # 生成後枚数 34 num_image = 5 35 36 # 生成 37 g = datagen.flow(data, save_to_dir="../1_data/imagedatagenerator/" +str(label_katakana), 38 save_format='png', save_prefix='out_%s_from_npy_'%label_katakana) 39 for i in range(num_image): 40 batches = g.next() 41 X.append(batches) 42 y.append(label) 43 print(batches.shape) 44X=np.array(X) 45Y=np.array(Y)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

toast-uz

2020/10/17 14:52

> これを15000,1,28,28,1)の4次元配列で保存 5次元のままになっています。
r.k1991

2020/10/17 14:59

大変失礼しました。修正しました。 15000,28,28,1の4次元配列で保存したいです。
guest

回答1

0

ベストアンサー

以下のような形で大きさ1の次元(0から数える)を「しぼる」ことができます。以下のコードでは2番目の次元をしぼっていますので、質問者様の期待する形になっていると思います。

Python

1X2 = np.squeeze(X, 1).copy()

投稿2020/10/17 15:41

toast-uz

総合スコア3266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

r.k1991

2020/10/18 00:23

ありがとうございました!こちらで解決しました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問