🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

1391閲覧

個人認識を行いたいのですが、学習データの次元数が合わなくて困っています...

yamakagasi1725

総合スコア5

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/11/03 14:54

編集2019/11/03 15:12

前提・実現したいこと

python初心者です。
scikit-learnを用いて自分の顔を学習させ、動画から人の顔を認識し、自分の顔の写真のみディレクトリに保存するということを行いないたいのですが、以下のエラーコードがでてしまい、処理が行えません。

発生している問題・エラーメッセージ

File "C:/Users/hoge/PycharmProjects/resarch372/20191029/self/顔-個人認証.py", line 48, in <module> pred_y = clf.predict([img_data]) File "C:\Users\hoge\PycharmProjects\resarch372\venv\lib\site-packages\sklearn\ensemble\forest.py", line 545, in predict proba = self.predict_proba(X) 顔の座標= 15 167 169 169 File "C:\Users\hoge\PycharmProjects\resarch372\venv\lib\site-packages\sklearn\ensemble\forest.py", line 588, in predict_proba X = self._validate_X_predict(X) File "C:\Users\hoge\PycharmProjects\resarch372\venv\lib\site-packages\sklearn\ensemble\forest.py", line 359, in _validate_X_predict return self.estimators_[0]._validate_X_predict(X, check_input=True) File "C:\Users\hoge\PycharmProjects\resarch372\venv\lib\site-packages\sklearn\tree\tree.py", line 402, in _validate_X_predict % (self.n_features_, n_features)) ValueError: Number of features of the model must match the input. Model n_features is 10000 and input n_features is 30000

該当のソースコード

python

1#顔の学習 2import cv2 3import os, glob 4from PIL import Image 5from sklearn.model_selection import train_test_split 6from sklearn import datasets,metrics 7from sklearn.ensemble import RandomForestClassifier 8from sklearn.metrics import accuracy_score 9from sklearn.externals import joblib 10 11img_size = (100, 100) 12 13path = os.path.dirname(os.path.abspath(__file__)) 14path_ore = path + '/ore' 15path_hoka = path + '/hoka' 16x = [] 17y = [] 18 19def read_dir(path, label): 20 files = glob.glob(path + "/*.jpg") 21 for f in files: 22 img = cv2.imread(f) 23 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) 24 gray = cv2.GaussianBlur(gray, (9, 9), 0) 25 img_b = cv2.threshold(gray, 100, 255, cv2.THRESH_BINARY)[1] 26 img_b = cv2.resize(img_b, img_size) 27 img_data = img_b.reshape(-1, ) 28 x.append(img_data) 29 y.append(label) 30 31read_dir(path_hoka, 0) 32read_dir(path_ore, 1) 33 34x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2) 35 36clf = RandomForestClassifier() 37clf.fit(x_train,y_train) 38 39y_pred = clf.predict(x_test) 40print(accuracy_score(y_test, y_pred)) 41 42joblib.dump(clf, 'ore.pkl') 43 44 45#動画からの検出 46 47import cv2, os, copy 48from sklearn.externals import joblib 49 50clf = joblib.load("ore.pkl") 51output_dir = "./ore-kojinn" 52img_last = None 53img_c = None 54count = 0 55frame_count = 0 56no = 0 57 58cascade_file = ('haarcascade_frontalface_alt.xml') 59cascade = cv2.CascadeClassifier(cascade_file) 60 61 62if not os.path.isdir(output_dir): 63 os.mkdir(output_dir) 64 65cap = cv2.VideoCapture("nakayosi.mp4") 66while True: 67 ore,frame = cap.read() 68 if not ore: 69 break 70 frame = cv2.resize(frame,(600,400)) 71 frame2 = copy.copy(frame) 72 frame_count +=1 73 74 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) 75 gray = cv2.GaussianBlur(gray, (15,15), 0) 76 img_b = cv2.threshold(gray, 127,255,cv2.THRESH_BINARY)[1] 77 78 # 顔 79 if img_c is None: 80 img_c = img_b 81 continue 82 83 face_list = cascade.detectMultiScale(frame, minSize=(100, 100)) 84 85 for (x, y, w, h) in face_list: 86 87 print("顔の座標=", x, y, w, h) 88 red = (0, 0, 255) 89 cv2.rectangle(frame, (x, y), (x + w, y + h), red, thickness=2) 90 img_c = frame[y:y + h, x:x + w] 91 img_d = cv2.resize(img_c, (100, 100)) 92 img_data = img_d.reshape(-1,) 93 94 pred_y = clf.predict([img_data]) 95 96 if pred_y[0] == 1: 97 outfile = output_dir + "/" + str(no) + ".jpg" 98 cv2.imwrite(outfile, img_c) 99 no += 1 100 101 cv2.imshow("douga", frame2) 102 103 104 105 img_c = img_b 106 107 if cv2.waitKey(1) == 13: 108 break 109cap.release() 110cv2.destroyAllWindows() 111print("ok", no,"/",frame_count)

試したこと

学習データの次元数が問題だと考えたので、resizeの関数をいろいろ変えてみたりしたのですが、同じようなエラーばかり出てしまい、どのようにすればよいかわかりません...

補足情報(FW/ツールのバージョンなど)

python3.7.5

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2019/11/03 15:03

エラーメッセージは全文掲載いただいた方が回答がつきやすくなるかと思います。
guest

回答1

0

ベストアンサー

学習データの次元数が問題だと考えたので、resizeの関数をいろいろ変えてみたりしたのですが、
同じようなエラーばかり出てしまい、どのようにすればよいかわかりません...

経験上、次元が×3や÷3で違う場合は大概がchの設定ミスですので、まずはchを疑うと良いと思います。


||式|画像の中身|由来|チャネル数|
|:--|:--|:--|:--||
|学習|clf.fit(x_train,y_train)|x_train|gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)|1|
|推論|pred_y = clf.predict([img_data])|img_data|img_c = frame[y:y + h, x:x + w]|3(?)|

OpenCVで画像を採取する際に、cap.read()を使っていますが、この際に画像が3chになっていると思います。ですので、pred_y = clf.predict([img_data])に突っ込むデータを1chに減らせば問題なく動くはずです。

投稿2019/11/03 21:59

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yamakagasi1725

2019/11/04 11:06

無事読み込むことができました。ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問