質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3811閲覧

scikit-learnにおける手書き文字認識

11_aria

総合スコア11

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/05/22 09:50

前提・実現したいこと

scikit-learnの中にあるdigitsを用いて手書き文字認識を行いたいと考えています。
以下の画像は認識を行いたい画像データ群です。
イメージ説明イメージ説明イメージ説明イメージ説明イメージ説明イメージ説明イメージ説明イメージ説明イメージ説明

ここで、digitsが8×8の大きさなので、認識を行いたい画像群も同じ8×8にしています。
まず、digitsデータとテストを行いたい画像群をロードし、digitsデータを訓練画像とし、svmでモデルを作成しています。
そして、テストを行いたい画像群でテストを行っています。
そこで、エラーが発生し、止まっています。
よければ、ご教授お願い致します。

発生している問題・エラーメッセージ

エラーメッセージは以下の通りです。

--------------------------------------------------------------------------- ValueError Traceback (most recent call last) <ipython-input-61-39a29d96a6f9> in <module> 31 32 # 分類器を使ってテストデータを分類する ---> 33 predicted_A = clf.predict(test_data_A) 34 35 # 分類結果を表示する C:\ProgramData\Anaconda3\lib\site-packages\sklearn\svm\base.py in predict(self, X) 565 Class labels for samples in X. 566 """ --> 567 y = super(BaseSVC, self).predict(X) 568 return self.classes_.take(np.asarray(y, dtype=np.intp)) 569 C:\ProgramData\Anaconda3\lib\site-packages\sklearn\svm\base.py in predict(self, X) 323 y_pred : array, shape (n_samples,) 324 """ --> 325 X = self._validate_for_predict(X) 326 predict = self._sparse_predict if self._sparse else self._dense_predict 327 return predict(X) C:\ProgramData\Anaconda3\lib\site-packages\sklearn\svm\base.py in _validate_for_predict(self, X) 476 raise ValueError("X.shape[1] = %d should be equal to %d, " 477 "the number of features at training time" % --> 478 (n_features, self.shape_fit_[1])) 479 return X 480 ValueError: X.shape[1] = 192 should be equal to 64, the number of features at training time

該当のソースコード

#モジュールインポート import os import numpy as np import matplotlib.pyplot as plt from sklearn import datasets from skimage import data import cv2 as cv2 from sklearn.externals import joblib from sklearn import svm #digitsデータをロード digits = datasets.load_digits() #テストデータをロード feature = np.array([data.imread(f'img/suuji_1/{path}') for path in os.listdir('img/suuji_1')]) feature = feature.reshape(len(feature), -1).astype(np.float64) #先頭から1796件をトレーニングデータとする train_data, train_target = digits.data[0:1796], digits.target[0:1796] #分類器の作成。SVMというアルゴリズムを選択 clf = svm.SVC(gamma=0.001, C=100.) #分類器に手書き数字データと正解ラベルの訓練データを与えて学習させる clf.fit(train_data, train_target) # テストデータとしてimg_1フォルダ内の画像を与える test_data_A = feature.data[0:9] # 分類器を使ってテストデータを分類する predicted_A = clf.predict(test_data_A) # 分類結果を表示する print(test_data_A)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

画像データ群がグレースケールではないため、RGBのぶん、3倍のデータ量をもっているため、

X.shape[1] = 192 should be equal to 64

となってしまっているのだと思います。digitsのデータはグレースケールなので64です。
PILでimg.convert('L')とかしたデータをimg/suuji_gray/ とかにおいてやればいいと思います。

投稿2019/05/22 10:27

tetsunosuke

総合スコア1292

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

11_aria

2019/05/22 23:40

回答ありがとうございます。グレースケール化し他画像で記載のプログラムを動かしたところ <memory at 0x000001FB886CBDC8> としか表示されません。 原因は何でしょうか・・・?
tetsunosuke

2019/05/23 00:14

分類結果として表示したいのは・・・predicted_Aではないですか? test_data_Aは feature.dataなので、memoryviewオブジェクトのようですね。
11_aria

2019/05/23 11:58

ありがとうございます!!!!無事に解決できました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問