質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Q&A

解決済

2回答

3606閲覧

機械学習で使うMNISTのようなデータセットを独自に作成するには

Kuro3210

総合スコア13

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

0グッド

0クリップ

投稿2019/04/03 17:09

プログラミングを初めて約1週間ほどの者です。現在ニューラルネットワークによる画像データの学習・予測プログラムを組もうとしています。
プログラミング技能が低いので、ニューラルネットワークの構築のほとんどをkerasに依存してプログラムを組んでいるのですが、ここで問題があります。

①ネットに落ちているコードの例は、レイヤーの組み方などにフォーカスしているものが多いため、材料として使うデータセットはMNISTなどすでに学習用に構築されたものを使っているものが多く、独自にデータセットを構築する方法がわからない。

②プログラミング能力が低いので、kerasで組んだレイヤーや学習部分のプログラムに影響を与えないように(データセットの作り方のせいで、kerasを使うのを止めてレイヤークラスをゼロからpythonで記述しなおすなどは極力避けたい。レイヤーが複雑になったときに面倒なので。)データセットを構築したい。

③理想はMNISTと同じデータセットの形式をとりたいが、MNISTの形式がわからない。また、MNIST形式にデータセットを構築していく方法がわからない。

の3点です。

現在データセットの構築方法の参考になるWebページなどもなかなか見つからない状態ですので、参考URLなど教えていただけたら幸いです。

また、ニューラルネットの学習用に現在組んでいるプログラムはTensorFlowのホームページに載っている初心者用の練習コードです。
ほとんどコピペですが、参考までに、自分が組んだコードを載せておきます。

python3

1#必要なモジュールのインポート 2from __future__ import absolute_import, division, print_function 3 4# TensorFlow and tf.keras 5import tensorflow as tf 6from tensorflow import keras 7 8# Helper libraries 9import numpy as np 10import matplotlib.pyplot as plt 11 12#MNISTのロード 13fashion_mnist = keras.datasets.fashion_mnist 14 15(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data() 16 17#画像ファイル(行列式)をピクセル値で0~1に正規化 18train_images = train_images / 255.0 19 20test_images = test_images / 255.0 21 22#レイヤーの構築 23model = keras.Sequential([ 24 keras.layers.Flatten(input_shape=(28, 28)), 25 keras.layers.Dense(128, activation=tf.nn.relu), 26 keras.layers.Dense(10, activation=tf.nn.softmax) 27]) 28 29#損失関数と最適化計算法を設定 30model.compile(optimizer='adam', 31 loss='sparse_categorical_crossentropy', 32 metrics=['accuracy']) 33 34#上の条件で最適化計算(学習) 35model.fit(train_images, train_labels, epochs=5, batch_size=1000) 36

Epoch 1/5
60000/60000 [==============================] - 1s 22us/sample - loss: 0.3813 - acc: 0.8669
Epoch 2/5
60000/60000 [==============================] - 1s 21us/sample - loss: 0.3662 - acc: 0.8735
Epoch 3/5
60000/60000 [==============================] - 1s 21us/sample - loss: 0.3549 - acc: 0.8761
Epoch 4/5
60000/60000 [==============================] - 1s 21us/sample - loss: 0.3462 - acc: 0.8789
Epoch 5/5
60000/60000 [==============================] - 1s 21us/sample - loss: 0.3367 - acc: 0.8819

python3

1#testデータに外挿。正確性を評価 2test_loss, test_acc = model.evaluate(test_images, test_labels) 3 4print('Test accuracy:', test_acc)

10000/10000 [==============================] - 0s 37us/sample - loss: 0.3835 - acc: 0.8661
Test accuracy: 0.8661

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

自己解決

opencvなどを用いて作成することができました。

投稿2019/04/09 02:53

Kuro3210

総合スコア13

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

「MNIST format」「MNIST 形式」などで Google 検索すれば、たくさん情報が出てきますので、それを参考に新しいデータセットを作ると良いと思います。

MNIST データの仕様を理解しよう
https://weblabo.oscasierra.net/python/ai-mnist-data-detail.html

投稿2019/04/03 22:47

nskydiving

総合スコア6500

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問