コード import os import sys import cv2 import numpy as np ## 画像データのクラスIDとパスを取得 # # @param dir_path 検索ディレクトリ # @return data_sets [クラスID, 画像データのパス]のリスト def getDataSet(dir_path): data_sets = [] sub_dirs = os.listdir(dir_path) for classId in sub_dirs: sub_dir_path = dir_path + '/' + classId img_files = os.listdir(sub_dir_path) for f in img_files: data_sets.append([classId, sub_dir_path + '/' + f]) return data_sets """ main """ # 定数定義 GRAYSCALE = 0 # KAZE特徴量抽出器 detector = cv2.KAZE_create() """ train """ print("train start") # 訓練データのパスを取得 train_set = getDataSet('train_img') # 辞書サイズ dictionarySize = 2 # Bag Of Visual Words分類器 bowTrainer = cv2.BOWKMeansTrainer(dictionarySize) # 各画像を分析 for i, (classId, data_path) in enumerate(train_set): # 進捗表示 sys.stdout.write(".") # グレースケールで画像読み込み gray = cv2.imread(data_path, GRAYSCALE) # 特徴点とその特徴を計算 keypoints, descriptors= detector.detectAndCompute(gray, None) # intからfloat32に変換 descriptors = descriptors.astype(np.float32) # 特徴ベクトルをBag Of Visual Words分類器にセット bowTrainer.add(descriptors) # Bag Of Visual Words分類器で特徴ベクトルを分類 codebook = bowTrainer.cluster() # 訓練完了 print("train finish") """ test """ print("test start") # テストデータのパス取得 test_set = getDataSet("test_img") # KNNを使って総当たりでマッチング matcher = cv2.BFMatcher() # Bag Of Visual Words抽出器 bowExtractor = cv2.BOWImgDescriptorExtractor(detector, matcher) # トレーニング結果をセット bowExtractor.setVocabulary(codebook) # 正しく学習できたか検証する for i, (classId, data_path) in enumerate(test_set): # グレースケールで読み込み gray = cv2.imread(data_path, GRAYSCALE) # 特徴点と特徴ベクトルを計算 keypoints, descriptors= detector.detectAndCompute(gray, None) # intからfloat32に変換 descriptors = descriptors.astype(np.float32) # Bag Of Visual Wordsの計算 bowDescriptors = bowExtractor.compute(gray, keypoints)
train-imgファイルを作りその中にも0と1のファイルを作り、0に猫画像、1に犬画像を2枚ずつ配置しておきます。
分からないのが、kmeansでカテゴリ分解した後に、各カテゴリ毎にそのカテゴリに入る特徴量の個数を集計してヒストグラムを作成する方法が分かりません。つまり、クラスタリングされた特徴量を集計しtrain_imgファイルの合計4つのヒストグラムで表したいということです。
どうして前回https://teratail.com/questions/82628のpashango2さんの解答ではいけないのですか?
あなたの回答
tips
プレビュー