質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.04%

  • Python 3.x

    3767questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • OpenCV

    800questions

    OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

  • TensorFlow

    451questions

  • 機械学習

    446questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

K最近傍法を用いた画像の分類

受付中

回答 1

投稿

  • 評価
  • クリップ 1
  • VIEW 117

SAMLY

score 1

前提・実現したいこと

K最近傍法で画像の2クラス分類を行っています.
MNIST以外のデータ画像を用いたいと考えていて先日質問させていただき,いいアドバイスをいただいたのですが以下のようなサイズが合わないという別のエラーが生じています.
2000は学習枚数,36.48は画像の高さと幅,1728は画素数の合計なのは把握していますがどうしてこのようなエラーが生じたか,またどうすれば解決し,実行できるかが不明です.

発生している問題・エラーメッセージ

Traceback (most recent call last):
  File "train9.py", line 54, in <module>
    predicted_value = sess.run(pred,feed_dict={x_train:X_traning, y_train:Y_traning, x_test:X_test[i,:]})
  File "C:\Users\LIP\Anaconda3\envs\tensorflow\lib\site-packages\tensorflow\python\client\session.py", line 889, in run
    run_metadata_ptr)
  File "C:\Users\LIP\Anaconda3\envs\tensorflow\lib\site-packages\tensorflow\python\client\session.py", line 1096, in _run
    % (np_val.shape, subfeed_t.name, str(subfeed_t.get_shape())))
ValueError: Cannot feed value of shape (2000, 36, 48) for Tensor 'Placeholder:0', which has shape '(?, 1728)'

該当のソースコード

#K近傍法のコード
import tensorflow as tf
import numpy as np
from load_dataset import load_dataset


# 学習データ
X_traning,Y_traning = load_dataset('./train_dataset',convert_type='RGB',flatten=True,normalize=True,one_hot_label=True)
X_test,Y_test = load_dataset('./test_dataset',convert_type='RGB',flatten=True,normalize=True,one_hot_label=True)


# モデルの入出力の設定
x_train = tf.placeholder(tf.float32, [None,48*36]) #traning input
y_train = tf.placeholder(tf.float32, [None,2]) #traning label
x_test = tf.placeholder(tf.float32, [48*36]) #testing input

# 比較する近傍ベクトルの数を設定
K = 3
nearest_neighbors = tf.Variable(tf.zeros([K]))

# 入力ベクトルと近傍ベクトルの距離を計算
distance = tf.negative(tf.reduce_sum(tf.abs(tf.add(x_train, tf.negative(x_test))),axis=1)) #L1
# 上でマイナスを付けたので、大きい順に取り出せばいい
values, indices = tf.nn.top_k(distance, k=K, sorted=False)

# 近傍値を保存するリスト
nn_vector = []
for i in range(K):
    nn_vector.append(tf.argmax(y_train[indices[i]], 0)) 

# 近傍ベクトルのリストをtensorflowの変数へ変換する
nearest_neighbors = nn_vector

# クラスラベル、そのインデックス、個数を計算
y, idx, count = tf.unique_with_counts(nearest_neighbors)
"""
例:
x = [1, 1, 2, 4, 4, 4, 7, 8, 8]
y, idx, count = unique_with_counts(x)
y ==&gt; [1, 2, 4, 7, 8]
idx ==&gt; [0, 0, 1, 2, 2, 2, 3, 4, 4]
count ==&gt; [2, 1, 3, 1, 2]
"""

# 最も個数の多いクラスを取り出す
pred = tf.slice(y, begin=[tf.argmax(count, 0)], size=tf.constant([1], dtype=tf.int64))[0]
# y = [ 1,  2,  3,  4, 11] count = [3, 2, 2, 7, 1] の時、 1を返す

accuracy = 0
init = tf.global_variables_initializer()

with tf.Session() as sess:

    for i in range(X_test.shape[0]):
        predicted_value = sess.run(pred,feed_dict={x_train:X_traning, y_train:Y_traning, x_test:X_test[i,:]})

        print("Test", i, "Prediction", predicted_value, "True Class:", np.argmax(Y_test[i]))

        if predicted_value == np.argmax(Y_test[i]):
                accuracy += 1.0

    accuracy /= len(Y_test)
    print("Accuracy:", accuracy)
#読み込むデータファイルのコード
from PIL import Image
import numpy as np
import os
try:
    import urllib.request
except ImportError:
    raise ImportError('You should use Python 3.x')
import os.path
import gzip
import pickle
import cv2

def _load_label(file_dir):
    data_files = os.listdir(file_dir)
    labels = []
    for file in data_files:
        l = file.split('-')[0]
        if(l == 'face'):
            labels.append(0)
        elif(l == 'non-face'):
            labels.append(1)

    print("Load label : Done!")

    return np.array(labels)

def _load_img(file_dir,convert_type='L'):
    data_files = os.listdir(file_dir)
    imgs = []
    for file in data_files:
        img = np.frombuffer(np.array(Image.open(file_dir+'/'+file).convert(convert_type)),dtype=np.uint8)
        img = cv2.resize(img, (48, 36))
        imgs.append(img)
    print("Load img : Done!")

    return np.array(imgs)

def _change_one_hot_label(X):
    #2のところは分類したいクラスの数
    T = np.zeros((X.size, 2))
    for idx, row in enumerate(T):
        row[X[idx]] = 1

    return T

def load_dataset(DIR_PATH,convert_type='L',normalize=True,flatten=True,one_hot_label=False):
    labels = _load_label(DIR_PATH)
    imgs = _load_img(DIR_PATH,convert_type)

    if normalize:
        imgs = imgs.astype(np.float32)
        imgs /= 255.0

    if not flatten:
        #用意した画像サイズ(48*36)
        if(convert_type == 'L'):
            imgs = imgs.reshape(-1,1,48,36)
        elif(convert_type == 'RGB'):
            imgs = imgs.reshape(-1,3,48,36)


    if one_hot_label:
        labels = _change_one_hot_label(labels)        

    return imgs,labels

試したこと

K近傍法のコードと読み込むデータのコードの作成を行いました.
画像は48×32画素のものを用いています.
学習枚数は2000枚,テスト枚数は400枚です.

補足情報(言語/FW/ツール等のバージョンなど)

Windows10 (64bit)
Python 3.5.4(仮想環境)(Anaconda4.4.0(64bit))
TensorFlow 1.4.0 

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

0

x_train = tf.placeholder(tf.float32, [None,48,36])
x_test = tf.placeholder(tf.float32, [48,36])
もしくは
predicted_value = sess.run(pred, feed_dict={x_train:X_traning.reshape(-1,48*36), y_train:Y_traning, x_test:X_test[i,:].reshape(-1,48*36)})

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 91.04%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python 3.x

    3767questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • OpenCV

    800questions

    OpenCV(オープンソースコンピュータービジョン)は、1999年にインテルが開発・公開したオープンソースのコンピュータビジョン向けのクロスプラットフォームライブラリです。

  • TensorFlow

    451questions

  • 機械学習

    446questions

    機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。