質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3467閲覧

画像判別、Valueerror: With n_samples=0, test_size=0.25

退会済みユーザー

退会済みユーザー

総合スコア0

Keras

Kerasは、TheanoやTensorFlow/CNTK対応のラッパーライブラリです。DeepLearningの数学的部分を短いコードでネットワークとして表現することが可能。DeepLearningの最新手法を迅速に試すことができます。

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/04/02 08:35

前提・実現したいこと

プログラミング初心者です。
TensorFlowとKersで機械学習をする方法を学んでいます。
Valueerrorが出て進められないので解決策を教えてください。

発生している問題・エラーメッセージ

エラーメッセージ
(t37) C:\Users\sun20\Documents\flickr>python nn-flower.py
Using TensorFlow backend.
Traceback (most recent call last):
File "nn-flower.py", line 45, in <module>
main()
File "nn-flower.py", line 20, in main
x_train, x_test, y_train, y_test = train_test_split(x, y)
File "C:\Users\sun20\anaconda3\envs\t37\lib\site-packages\sklearn\model_selection_split.py", line 2176, in train_test_split
default_test_size=0.25)
File "C:\Users\sun20\anaconda3\envs\t37\lib\site-packages\sklearn\model_selection_split.py", line 1861, in _validate_shuffle_split
train_size)
ValueError: With n_samples=0, test_size=0.25 and train_size=None, the resulting train set will be empty. Adjust any of the aforementioned parameters.

該当のソースコード

【image_to_db.py】 # 画像をnumpy形式に変換するプログラム import numpy as np from PIL import Image import os, glob, random # 変数の初期化 photo_size = 150 x = [] y = [] # path以下の画像を最大max_photoだけ読む def glob_images(path, lael, max_photo): #ファイル一覧を得る files = glob.glob(path + "/*.jpg") random.shuffle(files) #各ファイルを処理 for i, f in enumerate(files): if i >=max_photo: break #画像ファイルを読む img = Image.open(f) img = img.convert("RGB") # 同一サイズにリサイズ img = img.resize((photo_size, photo_size)) # numpy形式に変換 data = np.asarray(img) data = data / 256 data = data.reshape(photo_size, photo_size, 3) X.append(data) Y.append(label) # 最大枚数max_photoのデータセットを作る def make_dataset(max_photo, outfile): global X global Y X = [] Y = [] # 各画像のフォルダーから写真を読み込む glob_images(".sakura-ok", 0, max_photo) glob_images(".sunflower-ok", 1, max_photo) glob_images(".rose-ok", 2, max_photo) X = np.array(X, dtype=np.float32) np.savez(outfile, x=x, y=y) print("saved:" + outfile) # データセットを2種類作成する make_dataset(100, "photo-min.npz") make_dataset(300, "photo.npz") ------------------------------------------------------------------------------------------------------ 【nn-flower.py】 from sklearn.model_selection import train_test_split from keras.models import Sequential from keras.layers import Activation, Dropout, Dense from keras.utils import np_utils import numpy as np # 変数の宣言 classes = 3 data_size = 150 * 150 * 3 # データを学習しモデルを評価する def main(): #データの読み込み data = np.load("./photo-min.npz") x = data["x"] y = data["y"] #データを2次元に変形する x = np.reshape(x, (-1, data_size)) #訓練データとテストデータに分類 x_train, x_test, y_train, y_test = train_test_split(x, y) # モデルを訓練し評価 model = train(x_train, y_train) model_eval(model, x_test, y_test) # モデルを構築しデータを学習する def train(x, y): #モデルの構築 model = Sequential() model.add(Dense(units=64, input_dim=(data_size))) model.add(Activation('relu')) model.add(Dense(units=classes)) model.add(Activation('softmax')) model.compile(loss='sparse_categorical_crossentropy', optimizer='sgd', metrics=['accuracy']) model.fit(x, y, epochs=60) return model # モデルを評価する def model_eval(model, x_test, y_test): score = model.evaluate(x_test, y_test) print('loss=', score[0]) print('accuracy=', score[1]) if __name__ == "__main__": main()

試したこと

同じエラーについて調べましたが解決できませんでした。

補足情報(FW/ツールのバージョンなど)

python3.7.10

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

推測ですが、カレントディレクトリの下に

".sakura-ok"
".sunflower-ok"
".rose-ok"

というサブディレクトリがないか、あるいはその中身が空です。

どこに画像ファイルがあるかを確認して、そのパスを正しく指定しましょう。

投稿2021/04/02 09:23

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2021/04/02 09:35

回答ありがとうございます。 C:\Users\sun20\Documents\flickrに、sakura-ok sunflower-ok rose-okフォルダがあり、 その中にそれぞれ画像が入っているのですが、この場合はどのようにパスを指定すればよいですか?
ppaul

2021/04/02 09:39

".sakura-ok"ではなく、"sakura-ok"なのですね。 glob_images("C:\Users\sun20\Documents\flickr\sakura-ok", 0, max_photo) glob_images("C:\Users\sun20\Documents\flickr\sunflower-ok", 1, max_photo) glob_images("C:\Users\sun20\Documents\flickr\rose-ok", 2, max_photo) に変更してみてください。
退会済みユーザー

退会済みユーザー

2021/04/02 09:56

".sakura-ok"の部分は私が入力ミスをしていました。すみませんでした。 教えていただいたコードに書き換えてphoto.npzとphoto-min.npzを再生成し、 nn-flower.pyを実行しましたが同様のエラーが出ました。 (t37) C:\Users\sun20\Documents\flickr>python nn-flower.py Using TensorFlow backend. Traceback (most recent call last): File "nn-flower.py", line 45, in <module> main() File "nn-flower.py", line 20, in main x_train, x_test, y_train, y_test = train_test_split(x, y) File "C:\Users\sun20\anaconda3\envs\t37\lib\site-packages\sklearn\model_selection\_split.py", line 2176, in train_test_split default_test_size=0.25) File "C:\Users\sun20\anaconda3\envs\t37\lib\site-packages\sklearn\model_selection\_split.py", line 1861, in _validate_shuffle_split train_size) ValueError: With n_samples=0, test_size=0.25 and train_size=None, the resulting train set will be empty. Adjust any of the aforementioned parameters.
ppaul

2021/04/02 10:20

def glob_imagesの最後の行にprint(len(x))を入れて何が出力されるか見てみてください。 おそらく0が表示されると思いますが、念のために確認しておいてください。
退会済みユーザー

退会済みユーザー

2021/04/03 04:21

返信が遅くなり申し訳ありません。 print(len(x))を入れると確かに0がたくさん表示されました。
ppaul

2021/04/05 02:56

ということは画像ファイルを読み込めていないと言うことですね。 import glob print(glob.glob("C:\Users\sun20\Documents\flickr\sakura-ok/*.jpg" とやると何が表示されますか。
退会済みユーザー

退会済みユーザー

2021/04/05 09:08

'C:\Users\sun20\Documents\flickr\sakura-ok\13536993244.jpg', 'C:\Users\sun20\Documents\flickr\sakura-ok\13561856175.jpg', ~~~~~~~~~~~~~~~~~~~~~省略~~~~~~~~~~~~~~~~~~~~~~~~ 'C:\Users\sun20\Documents\flickr\sakura-ok\9834264523.jpg', 'C:\Users\sun20\Documents\flickr\sakura-ok\99328601.jpg'] saved:photo-min.npz saved:photo.npz このように表示されました。
退会済みユーザー

退会済みユーザー

2021/04/05 09:33

image_to_db.pyのxとyが大文字になっていて、それを直したらうまく動作しました。 ケアレスミスでお時間を奪ってしまいすみませんでした。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問