🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

793閲覧

python 学習用データの保存がされない

morisoh

総合スコア2

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

保存

保存(save)とは、特定のファイルを、ハードディスク等の外部記憶装置に記録する行為を指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/01/06 05:35

前提・実現したいこと

学習データを元に画像判別をしたいですが、np.saveをした後にコンパイル用プログラムでnpyを読み込み、念の為

python

1print(X_train.shape) 2print(y_train.shape) 3print(X_test.shape) 4print(y_test.shape)

をしてみると

python

1(0,) 2(0,) 3(0,) 4(0,)

となってしまいます。
正しく学習できてないようなので治したいです

該当のソースコード

python

1from PIL import Image 2import os, glob 3import numpy as np 4import random, math 5 6#学習用画像が保存されているディレクトリ 7train_dir = "E:\python\monster_py\monster_py" 8 9#テスト用画像が保存されているディレクトリ 10test_dir = "E:\python\dis_download" 11 12# モンスターの種類 13categories = ["モンスターエナジー","モンスターエナジーパイプラインパンチ", 14"モンスターキューバリブレ","モンスターエナジーアブソリュートリーゼロ" 15,"モンスターエナジーカオス","モンスターエナジーウルトラパラダイス" 16,"モンスターエナジーウルトラ"] 17# 画像データ用配列 18X = [] 19# ラベルデータ用配列 20Y = [] 21 22#画像データごとにadd_sample()を呼び出し、X,Yの配列を返す関数 23def make_sample(files): 24 global X, Y 25 X = [] 26 Y = [] 27 for cat, fname in files: 28 add_sample(cat, fname) 29 return np.array(X), np.array(Y) 30 31def add_sample(cat, fname): 32 img = Image.open(fname) 33 img = img.convert("RGB") 34 img = img.resize((150,150)) 35 data = np.asarray(img) 36 X.append(data) 37 Y.append(cat) 38 39#学習用画像 40trainfiles = [] 41#テスト用画像 42testfiles = [] 43 44for idx, cat in enumerate(categories): 45 image_dir = train_dir + "\" + cat 46 files = glob.glob(image_dir + "\*.jpg") 47 for f in files: 48 trainfiles.append((idx, f)) 49 50for idx, cat in enumerate(categories): 51 image_dir = test_dir + "\" + cat 52 files = glob.glob(image_dir + "\*.jpg") 53 for f in files: 54 testfiles.append((idx, f)) 55 56X_train, y_train = make_sample(trainfiles) 57X_test, y_test = make_sample(testfiles) 58xy = (X_train, X_test, y_train, y_test) 59#データを保存する 60np.save("E:\python\monster_data.npy", xy)

###参考
https://qiita.com/kojikoji_ksnv/items/12dfe9075cb1dd3afe59

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

正しく学習されていないというより、プログラムが根本的に間違えているのではないですか?

shapeが(0,)になっている、X_trainとy_trainは、make_sampleの返り値です。

X_train, y_train = make_sample(trainfiles)

そこで、make_sampleのコード(下記)を見ると、空リスト XとYが作られて、それをnp.arrayにしたものが返り値になっています。

def make_sample(files): global X, Y X = [] Y = [] for cat, fname in files: add_sample(cat, fname) return np.array(X), np.array(Y)

結果として、X_trainとY_trainの値は、np.array([])となります。

どこにも、学習とか、プログラムによる処理とか呼べる部分がありません。
なにか間違ったところから、不適切なコードを持ってきたのではないですか?

投稿2021/01/06 05:51

coco_bauer

総合スコア6915

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

morisoh

2021/01/06 05:57

質問文下記にある参考のサイトからディレクトリや種類だけ変更していました。 def make_sampleの部分を変えたらいけそうですね、ありがとうございます。
morisoh

2021/01/06 07:50

ベストアンサー後に失礼します https://teratail.com/questions/177659 にあるようにX,Yはglobal宣言をしているので空ではないと思うのですがどうでしょうか、ご教授頂けると幸いです
guest

0

Python

1xy = (X_train, X_test, y_train, y_test) 2#データを保存する 3np.save("E:\python\monster_data.npy", xy)

このままだとタプルで保存していることになってしまいます。4 つ別々のファイルで保存するかもしくは pickle を使うか検討しましょう。

投稿2021/01/06 05:40

A_kirisaki

総合スコア2853

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

morisoh

2021/01/06 05:54

個別に保存する方法でやってみましたが、治りませんでした 学習用コードを ``` x = (X_train) y = (X_test) a = (y_train) b = (y_test) #データを保存する np.save("E:\python\monster_data_X_train.npy", x) np.save("E:\python\monster_data_X_test.npy", y) np.save("E:\python\monster_data_Y_train.npy", a) np.save("E:\python\monster_data_Y_test.npy", b) ``` とし、np.loadを ``` X_train = np.load("E:\python\monster_data_X_train.npy") X_test = np.load("E:\python\monster_data_X_test.npy") y_train = np.load("E:\python\monster_data_Y_train.npy") y_test = np.load("E:\python\monster_data_Y_test.npy") ``` としました
A_kirisaki

2021/01/06 05:56

coco_bauer さんの言うとおり他の部分が良くないようですね。少しずつ試してみたらよいのでは?
morisoh

2021/01/06 06:04

ありがとうございます。少々急ぎ目でやっていたのでひとつずつ確認しながら試してみます
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問