質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2205閲覧

pythonで、数字を読み込む機械学習がうまくいきません

akito.h

総合スコア2

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/06/18 14:49

編集2020/06/18 14:51

前提・実現したいこと

Python1年生という書籍で勉強している超初心者です。
以下のソースコードで、初歩的な機械学習を作っているのですが、何の数字を書いてプログラムを実行しても「1」と返ってきてしまい、うまく機械学習データが読み込めていないようです。
対応についてご教示いただきたいです。

該当のソースコード

python

import sklearn.datasets
import sklearn.svm
import PIL.Image
import numpy

def imageToData(filename):
grayImage=PIL.Image.open(filename).convert("L")
grayImage=grayImage.resize((8,8),PIL.Image.ANTIALIAS)
numImage=numpy.asarray(grayImage,dtype=float)
numImage=numpy.floor(16-16*(numImage/256))
numImage=numImage.flatten()

return numImage

def predictDigits(data):

digits=sklearn.datasets.load_digits()

clf=sklearn.svm.SVC(gamma=0.001)
clf.fit(digits.data,digits.target)

n=clf.predict([data])
print("予測=",n)

data = imageToData("5.png")
predictDigits(data)

試したこと

画像ファイルは.pyファイルと同じデスクトップに保存し、2〜5のいくつかの数字を何回か書き直しましたが、全て「1」と返ってきてしまいます。

補足情報(FW/ツールのバージョンなど)

どの数字でも、
予測= [1]
と返ってきます。

学習用データの読み込み、機械学習がうまくいっていないのでしょうか。よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2020/06/18 15:02

その書籍は持っていないのですが、書籍に記載されている通りにやってもうまくいかないということでしょうか?
yymmt

2020/06/18 15:51

data = imageToData("5.png")として作成したdataを一度みて見るのはどうでしょう?作った画像を8x8ピクセルの画像に直した際、本当に1に見えている可能性があります。この行の下あたりに import matplotlib.pyplot as plt plt.imshow(data.reshape(8, 8), cmap="gray") plt.show() と追加して見てください。ちなみに上記ソースコードを私が手書きで5と書いた数字は9と判断されました・・・。
meg_

2020/06/18 22:15

コードは「コードの挿入」で記入してください。
akito.h

2020/06/19 13:48

tiitoi様 はい、そうなんです・・・原因がわからず、対応ができないです。 yymmt様 ありがとうございます。見てみると確かに・・・荒くて5には見えにくいですね。ただ何度大きく書き直してもうまく読み取りませんでした・・・これは、ピクセル数を変えるといいのでしょうか?
yymmt

2020/06/19 14:01

ピクセル数を変えるとclf.fit()でエラーが出ると思いますのでNGです。学習に使用したデータと同じ形式の入力しか受付けません。あとSVMは画像認識では性能は出にくいです。その書籍がどういうものか分かりませんが、もしかしたら段階的に性能が出るモデルへとシフトしていく作りなのかも知れません。
akito.h

2020/06/19 14:24

ありがとうございました。仰る通り、エラーが出ました。 そうするとコードの問題というよりは、SVM自体の問題ということでしょうか。それであればとりあえずは安心です。ありがとうございました。
guest

回答1

0

ベストアンサー

手元で確認しましたが、SVM で推論できました。

自作した画像は白い背景に黒い文字で作成しましたか?

イメージ説明

以下の手順で作成しました。

  1. ペイントを開いて、100x100 とか縦横が同じ大きさのキャンバスを作成する
  2. 白い背景に黒いペンで数字を書く

python

1import sklearn.datasets 2import sklearn.svm 3import PIL.Image 4import numpy 5 6 7def imageToData(filename): 8 grayImage = PIL.Image.open(filename).convert("L") 9 grayImage = grayImage.resize((8, 8), PIL.Image.ANTIALIAS) 10 numImage = numpy.asarray(grayImage, dtype=float) 11 numImage = numpy.floor(16 - 16 * (numImage / 256)) 12 numImage = numImage.flatten() 13 14 return numImage 15 16 17def predictDigits(data): 18 digits = sklearn.datasets.load_digits() 19 20 clf = sklearn.svm.SVC(gamma=0.001) 21 clf.fit(digits.data, digits.target) 22 23 n = clf.predict([data]) 24 print("予測=", n) 25 26 27data = imageToData("9.png") 28predictDigits(data)

投稿2020/06/19 14:40

編集2020/06/19 14:49
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

akito.h

2020/06/21 07:30

ありがとうございます。解決しました。 結論から言いますと、縦横比が1:1でなかったため、数字の認識がうまくいきませんでした。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問