質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

701閲覧

[機械学習] 指定した行・列の情報を保持した空の配列の作り方

harug

総合スコア28

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/09/22 03:38

前提

pythonで画像データを用いた機械学習を実装しています.
クラス分けをしラベル付けされた画像を用いているのですが,その中のあるクラスの画像数が2枚または1枚しかないものがあります.

こちらの都合上,trainデータとtestデータの分割は手作業で行っていますのでこのクラスの画像をtrainデータとtestデータに分割すると,train:test → 2:0,1:0 というようにtestデータが0枚になってしまうケースがあります.

簡略化していますが,現在使用しているコードでは以下のようになっています.

python

1####以下はtestデータに対して行うものです#### 2height = 50 # 入力画像の縦のpx 3width = 200 # 入力画像の横のpx 4 5data = np.empty([0, width], dtype='uint8') # 各画像(numpy.ndarray)を格納する配列 6labels = np.empty([0, 1], dtype='uint8')  # 各画像のラベルを格納する配列 7 8# すべての画像に対して以下の処理を繰り返す 9data = np.append(data, img, axis=0) # imgは各画像の多次元配列numpy.ndarray 10labels = np.append(labels, i) # iは各画像につけられたラベル

実現したいこと

そこで,testデータが0枚のクラスではimgは,画像のheight, widthの情報は持たせたまま空の配列を生成できるようにしたいのですが,どのように実現すればよいのかが分かりません.

試したこと

調べたところnp.empty()というもので空配列を作ることができ,testデータが0枚のクラスでは以下のように画像のheight, widthの情報を持たせた空配列をimgとして生成しましたが,なぜかimgの各要素には値が入っています.
そのためimgは一つの画像として生成されてしまうため,これを実現できません.

python

1img = np.empty([height, width], dtype='uint8') 2 3####imgの中身#### 4array([[1.39200593e-311, 1.39200483e-311, 2.12199579e-314, ..., 5 4.43181969e+025, 6.02669610e+175, 2.26070879e+271], 6 [7.79952706e-143, 1.35507324e+248, 4.11737758e-027, ..., 7 8.39833674e-095, 1.91081333e+214, 3.03435270e-086], 8 [9.45909065e-154, 2.16401696e-027, 6.01334514e-154, ..., 9 3.94655055e+180, 1.22841379e+169, 6.96742179e+252], 10 ..., 11 [9.45906221e-154, 2.16401696e-027, 6.01334514e-154, ..., 12 1.16312003e+253, 1.97453180e-153, 6.01346953e-154], 13 [8.42241166e+252, 4.96850937e+180, 5.02416738e+180, ..., 14 8.87693539e+252, 8.76391296e+252, 5.02049779e+276], 15 [5.12558197e-027, 6.01334514e-154, 1.71653323e+219, ..., 16 1.62607037e-086, 6.01334619e-154, 2.04918907e+214]])

現在はこちらの対処法がわからず,とりあえずはtestデータが0枚のところにはnp.zeros()で真っ黒の画像を一枚だけ生成し,train:test → 2:1,1:1といった風に対処しています.(これが正しいのかは分かりませんが...)

----まとめ----
・画像のheight, widthの情報を持たせた空の配列を生成することは可能かどうか.

・現在の真っ黒の画像で補完する方法に問題はないか.

また,機械学習で画像認識を行うとき,入力する画像(numpy.ndarray)とそれに対応するラベルがセットとなりますが今回のような場合でtestデータが0枚のところは,空の配列をappendするにも画像の縦横の長さの情報は持たせた方が機械学習の内部処理的にはいいのでしょうか.
それともただ単にimg = []としてappendしてしまっても問題ないのでしょうか.

併せてご回答いただけますとありがたいです.
よろしくお願いします.

補足情報(FW/ツールのバージョンなど)

ubuntu 20.04
Python 3.8.10

tensorflow-gpu 2.5.3
keras 2.8.0
numpy 1.19.5

jupyter lab 2.3.2
ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

bsdfan

2022/09/22 08:15

numpy.empty() は空の配列を作成するのではなく、未初期化の配列を作るものです。 使用中のコードでは、shapeに[0, 1]や[0, width]と0が入っているため、結果として空の配列が作られているだけです。 (空というのは、ゼロ埋めという意味ではなく、サイズがゼロの配列という意味で書いています)
guest

回答1

0

ベストアンサー

指定した配列と同じ属性の空の配列を作成するにはnumpy.zeros_like が良いかと思います。

numpy.zeros_like

投稿2022/09/22 06:20

編集2022/09/22 06:23
meg_

総合スコア10602

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

harug

2022/09/25 13:44

ご回答いただきありがとうございます. np.zeros_like を使用すると同じ属性で要素がすべて0の配列が出来ました. しかしこれではすべて画素地値0,すなわち真っ黒の画像が生成されたことになります. 今のソースコードではしょうがないことですが,この真っ黒なデータをテストデータとして使っていいものなのか…とも思うのですがどうでしょう.
meg_

2022/09/25 15:11

> 画像のheight, widthの情報は持たせたまま空の配列を生成できるようにしたいのですが,どのように実現すればよいのかが分かりません. 上記について回答いたしました。 「testデータが0枚」が問題であればそうならないようにするのが対策かと思います。テストデータは増やせないのでしょうか?そもそも1~2枚では学習できない気がしますが。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問