質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.12%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

解決済

[機械学習] 指定した行・列の情報を保持した空の配列の作り方

harug
harug

総合スコア25

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0リアクション

0クリップ

427閲覧

投稿2022/09/22 03:38

前提

pythonで画像データを用いた機械学習を実装しています.
クラス分けをしラベル付けされた画像を用いているのですが,その中のあるクラスの画像数が2枚または1枚しかないものがあります.

こちらの都合上,trainデータとtestデータの分割は手作業で行っていますのでこのクラスの画像をtrainデータとtestデータに分割すると,train:test → 2:0,1:0 というようにtestデータが0枚になってしまうケースがあります.

簡略化していますが,現在使用しているコードでは以下のようになっています.

python

####以下はtestデータに対して行うものです#### height = 50 # 入力画像の縦のpx width = 200 # 入力画像の横のpx data = np.empty([0, width], dtype='uint8') # 各画像(numpy.ndarray)を格納する配列 labels = np.empty([0, 1], dtype='uint8')  # 各画像のラベルを格納する配列 # すべての画像に対して以下の処理を繰り返す data = np.append(data, img, axis=0) # imgは各画像の多次元配列numpy.ndarray labels = np.append(labels, i) # iは各画像につけられたラベル

実現したいこと

そこで,testデータが0枚のクラスではimgは,画像のheight, widthの情報は持たせたまま空の配列を生成できるようにしたいのですが,どのように実現すればよいのかが分かりません.

試したこと

調べたところnp.empty()というもので空配列を作ることができ,testデータが0枚のクラスでは以下のように画像のheight, widthの情報を持たせた空配列をimgとして生成しましたが,なぜかimgの各要素には値が入っています.
そのためimgは一つの画像として生成されてしまうため,これを実現できません.

python

img = np.empty([height, width], dtype='uint8') ####imgの中身#### array([[1.39200593e-311, 1.39200483e-311, 2.12199579e-314, ..., 4.43181969e+025, 6.02669610e+175, 2.26070879e+271], [7.79952706e-143, 1.35507324e+248, 4.11737758e-027, ..., 8.39833674e-095, 1.91081333e+214, 3.03435270e-086], [9.45909065e-154, 2.16401696e-027, 6.01334514e-154, ..., 3.94655055e+180, 1.22841379e+169, 6.96742179e+252], ..., [9.45906221e-154, 2.16401696e-027, 6.01334514e-154, ..., 1.16312003e+253, 1.97453180e-153, 6.01346953e-154], [8.42241166e+252, 4.96850937e+180, 5.02416738e+180, ..., 8.87693539e+252, 8.76391296e+252, 5.02049779e+276], [5.12558197e-027, 6.01334514e-154, 1.71653323e+219, ..., 1.62607037e-086, 6.01334619e-154, 2.04918907e+214]])

現在はこちらの対処法がわからず,とりあえずはtestデータが0枚のところにはnp.zeros()で真っ黒の画像を一枚だけ生成し,train:test → 2:1,1:1といった風に対処しています.(これが正しいのかは分かりませんが...)

----まとめ----
・画像のheight, widthの情報を持たせた空の配列を生成することは可能かどうか.

・現在の真っ黒の画像で補完する方法に問題はないか.

また,機械学習で画像認識を行うとき,入力する画像(numpy.ndarray)とそれに対応するラベルがセットとなりますが今回のような場合でtestデータが0枚のところは,空の配列をappendするにも画像の縦横の長さの情報は持たせた方が機械学習の内部処理的にはいいのでしょうか.
それともただ単にimg = []としてappendしてしまっても問題ないのでしょうか.

併せてご回答いただけますとありがたいです.
よろしくお願いします.

補足情報(FW/ツールのバージョンなど)

ubuntu 20.04
Python 3.8.10

tensorflow-gpu 2.5.3
keras 2.8.0
numpy 1.19.5

jupyter lab 2.3.2
ここにより詳細な情報を記載してください。

以下のような質問にはリアクションをつけましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

リアクションが多い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

bsdfan

2022/09/22 08:15

numpy.empty() は空の配列を作成するのではなく、未初期化の配列を作るものです。 使用中のコードでは、shapeに[0, 1]や[0, width]と0が入っているため、結果として空の配列が作られているだけです。 (空というのは、ゼロ埋めという意味ではなく、サイズがゼロの配列という意味で書いています)

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.12%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。