編集履歴

質問編集履歴

誤字

2019/06/02 02:16

投稿

matrix99999

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -4,7 +4,9 @@
 何とかコードはできましたが、
-学習してからのテストデータの精度を調べる方法がわかりません。
+学習してからのテストデータの精度を調べる方法がわからず、
+エラーが発生します。
 初心者ゆえの疑問です。

コード修正

2019/06/02 02:15

投稿

matrix99999

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -162,6 +162,36 @@
           validation_split=0.2)
+# 精度の評価
+scores = model.evaluate(data_set, verbose=1)
+print('Test loss:', scores[0])
+print('Test accuracy:', scores[1])
+# データの可視化（テストデータの先頭の10枚）
+for i in range(10):
+    plt.subplot(2, 5, i+1)
+    plt.imshow(data_set[i].reshape((28,28)), 'gray')
+plt.suptitle("テストデータの先頭の10枚",fontsize=20)
+plt.show()
+# 予測（テストデータの先頭の10枚）
+pred = np.argmax(model.predict(data_set[0:10]), axis=1)
+print(pred)
 model.summary()
@@ -174,60 +204,50 @@
 _________________________________________________________________
-Layer (type)                 Output Shape              Param #
-=================================================================
-conv2d_1 (Conv2D)            (None, 26, 78, 32)        320
-_________________________________________________________________
-activation_1 (Activation)    (None, 26, 78, 32)        0
-_________________________________________________________________
-conv2d_2 (Conv2D)            (None, 24, 76, 64)        18496
-_________________________________________________________________
-activation_2 (Activation)    (None, 24, 76, 64)        0
-_________________________________________________________________
-max_pooling2d_1 (MaxPooling2 (None, 12, 38, 64)        0
-_________________________________________________________________
-dropout_1 (Dropout)          (None, 12, 38, 64)        0
-_________________________________________________________________
-flatten_1 (Flatten)          (None, 29184)             0
-_________________________________________________________________
-dense_1 (Dense)              (None, 128)               3735680
-_________________________________________________________________
-activation_3 (Activation)    (None, 128)               0
-_________________________________________________________________
-dropout_2 (Dropout)          (None, 128)               0
-_________________________________________________________________
-dense_2 (Dense)              (None, 2219)              286251
-_________________________________________________________________
-activation_4 (Activation)    (None, 2219)              0
-=================================================================
-Total params: 4,040,747
-Trainable params: 4,040,747
-Non-trainable params: 0
+---------------------------------------------------------------------------
+IndexError                                Traceback (most recent call last)
+<ipython-input-2-d7df5a824556> in <module>()
+    110
+    111 # 精度の評価
+--> 112 scores = model.evaluate(data_set, verbose=1)
+    113 print('Test loss:', scores[0])
+    114 print('Test accuracy:', scores[1])
+~\Anaconda3\lib\site-packages\keras\engine\training.py in evaluate(self, x, y, batch_size, verbose, sample_weight, steps)
+   1111                                          batch_size=batch_size,
+   1112                                          verbose=verbose,
+-> 1113                                          steps=steps)
+   1114
+   1115     def predict(self, x,
+~\Anaconda3\lib\site-packages\keras\engine\training_arrays.py in test_loop(model, f, ins, batch_size, verbose, steps)
+    353     indices_for_conversion_to_dense = []
+    354     for i in range(len(feed)):
+--> 355         if issparse(ins[i]) and not K.is_sparse(feed[i]):
+    356             indices_for_conversion_to_dense.append(i)
+    357
+IndexError: list index out of range

コード修正

2019/06/02 02:14

投稿

matrix99999

スコア15

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -64,19 +64,7 @@
     my_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
-#    my_img = cv2.cvtColor(my_img, cv2.COLOR_GRAY2BGR)
-#幅、高さ 80*28
-    """
-#幅、高さ 80*28
-    my_img= cv2.resize(gray, (80, 28))
-    """
-#    my_img= cv2.resize(gray, (80, 28))
@@ -86,66 +74,22 @@
     my_img = my_img.flatten().tolist()
-#    my_img = my_img.tolist()
     data_set.append(my_img)
     labels.append(item.split('.')[0])
-#ぼかし
-#    my_img = cv2.GaussianBlur(img, (3, 3), 0)
-#    data_set.append(my_img.flatten().tolist())
-#    labels.append(item.split('.')[0])
-# フィルタを定義
-#    filt = np.array([[0, 1, 0],
-#                [1, 0, 1],
-#                [0, 1, 0]], np.uint8)
-# 膨張
-#    my_img =cv2.dilate(img, filt)
-#    data_set.append(my_img.flatten().tolist())
-#    labels.append(item.split('.')[0])
-# 収縮
-#    my_img =cv2.erode(img, filt)
-#    data_set.append(my_img.flatten().tolist())
-#    labels.append(item.split('.')[0])
-#    cv2.imwrite(str(file) + "_" + str(count) + ".jpg", img)
 # Numpyへ戻して
 data_set = np.array(data_set)/255
-#    print(data_set)
 import pandas as pd
@@ -156,24 +100,10 @@
 # 正規化
-#data_set  = data_set/255
 data_set = data_set.reshape([-1, 28, 80, 1])
-#if not os.path.exists("data_set"):
-#    os.mkdir("data_set")
-#for num, im in enumerate(data_set):
-    # まず保存先のディレクトリ"data_set/"を指定、番号を付けて保存
-#    cv2.imwrite("data_set/" + str(num) + ".jpg" ,im)
 # モデルの定義

書式改善

2019/06/02 00:42

投稿

matrix99999

スコア15

test CHANGED Viewed

	@@ -1 +1 @@
1	- python ~~openCV、~~MNISTを利用した文字認証
1	+ python MNISTを利用した文字認証

test CHANGED Viewed

@@ -1,14 +1,226 @@
-pythonを学習し初めてopenCVを利用した文字認証を行おうとしています。
+pythonを学習し初めて機械学習を利用した文字認証を行おうとしています。
 文字は４文字の英字で、幅80 高さ28のjpgファイルです。
+何とかコードはできましたが、
-このデータを読み込み数値を変えるコードを作成しています。
+学習してからのテストデータの精度を調べる方法がわかりません。
+初心者ゆえの疑問です。
-色々なものを参考にしながら作成しています。
+ご教示いただければと思います。
+```ここに言語を入力
+from keras.datasets import mnist
+from keras.layers import Dense, Dropout, Flatten, Activation
+from keras.layers import Conv2D, MaxPooling2D
+from keras.models import Sequential, load_model
+from keras.utils.np_utils import to_categorical
+from keras.utils.vis_utils import plot_model
+import numpy as np
+import matplotlib.pyplot as plt
+#import cv2
+import os
+%matplotlib inline
+path = "./data/"
+files = os.listdir(path)
+data_set = []
+labels=[]
+for item in files:
+    img = cv2.imread(os.path.join(path, item))
+#追加
+    img= cv2.resize(img, (80, 28))
+# グレースケール変換
+    my_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
+#    my_img = cv2.cvtColor(my_img, cv2.COLOR_GRAY2BGR)
-現在、分からないのは、
+#幅、高さ 80*28
+    """
+#幅、高さ 80*28
+    my_img= cv2.resize(gray, (80, 28))
+    """
+#    my_img= cv2.resize(gray, (80, 28))
+# リスト型へ変換してappendで追加
+    #print(my_img)
+    my_img = my_img.flatten().tolist()
+#    my_img = my_img.tolist()
+    data_set.append(my_img)
+    labels.append(item.split('.')[0])
+#ぼかし
+#    my_img = cv2.GaussianBlur(img, (3, 3), 0)
+#    data_set.append(my_img.flatten().tolist())
+#    labels.append(item.split('.')[0])
+# フィルタを定義
+#    filt = np.array([[0, 1, 0],
+#                [1, 0, 1],
+#                [0, 1, 0]], np.uint8)
+# 膨張
+#    my_img =cv2.dilate(img, filt)
+#    data_set.append(my_img.flatten().tolist())
+#    labels.append(item.split('.')[0])
+# 収縮
+#    my_img =cv2.erode(img, filt)
+#    data_set.append(my_img.flatten().tolist())
+#    labels.append(item.split('.')[0])
+#    cv2.imwrite(str(file) + "_" + str(count) + ".jpg", img)
+# Numpyへ戻して
+data_set = np.array(data_set)/255
+#    print(data_set)
+import pandas as pd
+labels_set=pd.get_dummies(labels).values
+# 正規化
+#data_set  = data_set/255
+data_set = data_set.reshape([-1, 28, 80, 1])
+#if not os.path.exists("data_set"):
+#    os.mkdir("data_set")
+#for num, im in enumerate(data_set):
+    # まず保存先のディレクトリ"data_set/"を指定、番号を付けて保存
+#    cv2.imwrite("data_set/" + str(num) + ".jpg" ,im)
+# モデルの定義
+model = Sequential()
+model.add(Conv2D(filters=32, kernel_size=(3, 3),input_shape=(28,80,1)))
+model.add(Activation('relu'))
+model.add(Conv2D(filters=64, kernel_size=(3, 3)))
+model.add(Activation('relu'))
+model.add(MaxPooling2D(pool_size=(2, 2)))
+model.add(Dropout(0.25))
+model.add(Flatten())
+model.add(Dense(128))
+model.add(Activation('relu'))
+model.add(Dropout(0.5))
+#かっこの中は重複なしのファイル数とする。 model.add(Dense(10))
+model.add(Dense(2219))
+model.add(Activation('softmax'))
+model.compile(loss='categorical_crossentropy',
+              optimizer='adadelta',
+              metrics=['accuracy'])
+#変更する余地あり epochs=100
 model.fit(data_set,labels_set,
@@ -20,258 +232,72 @@
           validation_split=0.2)
-のコードで下記エラーが発生します。
+model.summary()
-調べるとラベルの数と入力の数とラベルの数の不一致とまでは分かりましたが修正すべきことが
-分かりません。ご教示いただければと思います。
-コード
 ```
-ValueError                                Traceback (most recent call last)
-<ipython-input-10-104236dcb6cb> in <module>()
-    105           epochs=100,
-    106           verbose=1,
---> 107           validation_split=0.2)
-    108
-    109 model.summary()
-ValueError: Input arrays should have the same number of samples as target arrays. Found 26628 input samples and 8876 target samples.
-```ここに言語を入力
-from keras.datasets import mnist
-from keras.layers import Dense, Dropout, Flatten, Activation
-from keras.layers import Conv2D, MaxPooling2D
-from keras.models import Sequential, load_model
-from keras.utils.np_utils import to_categorical
-from keras.utils.vis_utils import plot_model
-import numpy as np
-import matplotlib.pyplot as plt
-import cv2
-import os
-%matplotlib inline
-path = "./data/"
-files = os.listdir(path)
-data_set = []
-labels=[]
-for item in files:
-    img = cv2.imread(os.path.join(path, item))
-#追加
-    img= cv2.resize(img, (80, 28))
-# グレースケール変換
-    my_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
-    my_img = cv2.cvtColor(my_img, cv2.COLOR_GRAY2BGR)
-#幅、高さ 80*28
-    """
-#幅、高さ 80*28
-    my_img= cv2.resize(gray, (80, 28))
-    """
-#    my_img= cv2.resize(gray, (80, 28))
-# リスト型へ変換してappendで追加
-    #print(my_img)
-    my_img = my_img.tolist()
-    data_set.append(my_img)
-    labels.append(item.split('.')[0])
-#ぼかし
-    my_img = cv2.GaussianBlur(img, (5, 5), 0)
-    data_set.append(my_img.tolist())
-    labels.append(item.split('.')[0])
-# フィルタを定義
-    filt = np.array([[0, 1, 0],
-                [1, 0, 1],
-                [0, 1, 0]], np.uint8)
-# 膨張
-    my_img =cv2.dilate(img, filt)
-    data_set.append(my_img.tolist())
-    labels.append(item.split('.')[0])
-# 収縮
-    my_img =cv2.erode(img, filt)
-    data_set.append(my_img.tolist())
-    labels.append(item.split('.')[0])
-#    cv2.imwrite(str(file) + "_" + str(count) + ".jpg", img)
-# Numpyへ戻して
-data_set = np.array(data_set)
-#    print(data_set)
-import pandas as pd
-labels_set=pd.get_dummies(labels).values
-# 正規化
-data_set  = data_set/255
-data_set = data_set.reshape([-1, 80, 28, 1])
-if not os.path.exists("data_set"):
-    os.mkdir("data_set")
-for num, im in enumerate(data_set):
-    # まず保存先のディレクトリ"data_set/"を指定、番号を付けて保存
-    cv2.imwrite("data_set/" + str(num) + ".jpg" ,im)
-# モデルの定義
-model = Sequential()
-model.add(Conv2D(filters=32, kernel_size=(3, 3),input_shape=(80,28,1)))
-model.add(Activation('relu'))
-model.add(Conv2D(filters=64, kernel_size=(3, 3)))
-model.add(Activation('relu'))
-model.add(MaxPooling2D(pool_size=(2, 2)))
-model.add(Dropout(0.25))
-model.add(Flatten())
-model.add(Dense(128))
-model.add(Activation('relu'))
-model.add(Dropout(0.5))
-#かっこの中は重複なしのファイル数とする。 model.add(Dense(10))
-model.add(Dense(2219))
-model.add(Activation('softmax'))
-model.compile(loss='categorical_crossentropy',
-              optimizer='adadelta',
-              metrics=['accuracy'])
-#変更する余地あり epochs=100
-model.fit(data_set,labels_set,
-          batch_size=128,
-          epochs=100,
-          verbose=1,
-          validation_split=0.2)
-model.summary()
-```
+実行結果：
+_________________________________________________________________
+Layer (type)                 Output Shape              Param #
+=================================================================
+conv2d_1 (Conv2D)            (None, 26, 78, 32)        320
+_________________________________________________________________
+activation_1 (Activation)    (None, 26, 78, 32)        0
+_________________________________________________________________
+conv2d_2 (Conv2D)            (None, 24, 76, 64)        18496
+_________________________________________________________________
+activation_2 (Activation)    (None, 24, 76, 64)        0
+_________________________________________________________________
+max_pooling2d_1 (MaxPooling2 (None, 12, 38, 64)        0
+_________________________________________________________________
+dropout_1 (Dropout)          (None, 12, 38, 64)        0
+_________________________________________________________________
+flatten_1 (Flatten)          (None, 29184)             0
+_________________________________________________________________
+dense_1 (Dense)              (None, 128)               3735680
+_________________________________________________________________
+activation_3 (Activation)    (None, 128)               0
+_________________________________________________________________
+dropout_2 (Dropout)          (None, 128)               0
+_________________________________________________________________
+dense_2 (Dense)              (None, 2219)              286251
+_________________________________________________________________
+activation_4 (Activation)    (None, 2219)              0
+=================================================================
+Total params: 4,040,747
+Trainable params: 4,040,747
+Non-trainable params: 0