質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

1回答

841閲覧

CNNにおいて自作データセットの作成

reonald

総合スコア32

ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2020/09/30 08:40

CNNで自作のデータセットを作成したいのですが,,,
現状のコードが下記です。

DATADIR = "aa" CATEGORIES = ["x2","z2"] IMG_SIZE = 28 training_data = [] def create_training_data(): for class_num, category in enumerate(CATEGORIES): path = os.path.join(DATADIR, category) for image_name in os.listdir(path): try: img_array = cv2.imread(os.path.join(path, image_name), cv2.IMREAD_GRAYSCALE) # 画像読み込み img_resize_array = cv2.resize(img_array, (IMG_SIZE, IMG_SIZE)) # 画像のリサイズ training_data.append([img_resize_array, class_num]) # 画像データ、ラベル情報を追加 except Exception as e: pass create_training_data() random.shuffle(training_data) # データをシャッフル x_train = [] # 画像データ y_train = [] # ラベル情報 # データセット作成 for feature, label in training_data: x_train.append(feature) y_train.append(label) # numpy配列に変換 x= np.array(x_train) y= np.array(y_train) x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2) x_train, x_test = x_train / 255.0, x_test / 255.0 コード

この方法で,[x2,y2]ファイルにある画像をトレーニングデータとテストデータに分けてデータセットを作成できたのですが,
ファイルにある写真ごとでトレーニングに使うかテストに使うかを分けたいです。
イメージとしては,[x2,y2]ファイルをトレーニングデータ,[x3,y3]ファイルをテストデータにするといった形です。
どなたかご意見よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

aokikenichi

2020/09/30 09:52

質問の意味が今一つ分からず、、、 「[x2,y2]ファイルにある画像をトレーニングデータとテストデータに分けてデータセットを作成できたのですが」 コードを見ると「CATEGORIES = ["x2","z2"]」 とあるのでこれのことでしょうか? 「[x2,y2]ファイル」とは class_num, categoryがそれぞれ"x2", "y2"であるファイルということでしょうか? 「for image_name in os.listdir(path):」 のループでファイルを取得しているので 「[x2,y2]ファイルをトレーニングデータ,[x3,y3]ファイルをテストデータにするといった形」 であればそれぞれをそのままトレーニング、テストデータとして読み込めばいいのでは?
meg_

2020/09/30 10:45

「トレーニングに使うかテストに使うか」はランダムにするべきではありませんか?
reonald

2020/10/01 06:03

そのまま分けて読み込めばできました。 ラベル情報などで頭が整理できてなかったです。ありがとうございました。
reonald

2020/10/01 06:04

ランダムにすべきなんですけど,モデルの精度をみてみたくて, どの写真がどう評価されているかを見やすくしたかったのでデータを分けてますを。
aokikenichi

2020/10/01 09:40

成功したようですので一応「回答」しておきます。
guest

回答1

0

ベストアンサー

「for image_name in os.listdir(path):」
のループでファイルを取得しているので
「[x2,y2]ファイルをトレーニングデータ,[x3,y3]ファイルをテストデータにするといった形」
であればそれぞれをそのままトレーニング、テストデータとして読み込めばいいのでは?

投稿2020/10/01 09:39

aokikenichi

総合スコア2218

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問