質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

解決済

ロジスティック回帰のエラー[X has 64 features, but LogisticRegression is expecting 2500 features as input.]について

mememe0331
mememe0331

総合スコア54

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

1回答

0評価

0クリップ

423閲覧

投稿2022/01/13 09:22

前提・実現したいこと

自作したデータセットを用いて、
入力した画像が犬か猫かを判別するプログラムを作成したいです。

学習させて、精度を求めるところまで、作成できたのですが、
画像を読み込んで、predictするとエラーが発生しました。

発生している問題・エラーメッセージ

X has 64 features, but LogisticRegression is expecting 2500 features as input. 翻訳: Xには64の機能がありますが、LogisticRegressionは入力として2500の機能を期待しています。

該当のソースコード

画像をテストデータにして、predictするプログラム。

Python

import cv2 import matplotlib.pyplot as plt %matplotlib inline def predict_digit(filename): #画像を読み込む my_img = cv2.imread(filename) plt.imshow(my_img) plt.show() #グレースケールに変換する my_img = cv2.cvtColor(my_img, cv2.COLOR_BGR2GRAY) # 8 * 8のサイズに変換する my_img = cv2.resize(my_img,(8,8)) # plt.imshow(my_img) # plt.show() #白黒反転する my_img = 15 - my_img // 16 plt.imshow(my_img) #画像を貼り付ける plt.axis('off') #グラフのメモリを消す plt.show() #画像を表示する # print(my_img) #二次元を一次元に変換 my_img = my_img.reshape((-1,64)) res = clf.predict(my_img) return res[0] n = predict_digit("dog.jpg") print("dog.jpg = " + str(n))

学習して、精度を出すまでのプログラム

Python3

#集めた画像データを学習データにする import matplotlib.pyplot as plt import os import cv2 import random import numpy as np DATADIR = "C:/Users/19t339/Documents/work/犬と猫/PetImages" CATEGORIES = ["Dog", "Cat"] IMG_SIZE = 50 training_data = [] def create_training_data(): for class_num, category in enumerate(CATEGORIES): path = os.path.join(DATADIR, category) for image_name in os.listdir(path): try: img_array = cv2.imread(os.path.join(path, image_name), cv2.IMREAD_GRAYSCALE) # 画像読み込み img_resize_array = cv2.resize(img_array, (IMG_SIZE, IMG_SIZE)) # 画像のリサイズ training_data.append([img_resize_array, class_num]) # 画像データ、ラベル情報を追加 except Exception as e: pass create_training_data() random.shuffle(training_data) # データをシャッフル X_train = [] # 画像データ y_train = [] # ラベル情報 # データセット作成 for feature, label in training_data: X_train.append(feature) y_train.append(label) # numpy配列に変換 X_train = np.array(X_train) y_train = np.array(y_train) #変数の名前を分かりやすくする X = X_train y = y_train #画像データの次元を3次元から2次元へ落としている X= X.reshape(len(X), -1).astype(np.float64) y= y.reshape(len(y), -1).astype(np.float64) #学習データとテストデータのシャッフル from sklearn.model_selection import ShuffleSplit ss = ShuffleSplit(n_splits=1, train_size=0.8, test_size=0.2, random_state=0) train_index, test_index = next(ss.split(X,y)) X_train, X_test = X[train_index], X[test_index] y_train, y_test = y[train_index], y[test_index] #学習と精度評価 from sklearn import linear_model clf = linear_model.LogisticRegression(solver='liblinear') clf.fit(X_train,y_train) clf.score(X_test,y_test)

試したこと

画像ファイルの拡張子の変更。
エラーメッセージの検索

補足情報(FW/ツールのバージョンなど)

jupiter notebook

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。