#やりたいこと
画像データの教師なしクラスタリングを行いたい。
そのために、Google Drive内に用意した1042枚のtifファイルをリストにして読み込ませた。
その後、リストを配列に変換したところ、次元が消失し、クラスタリングは出来ないものとなった。
理想としては、MNISTの手書き数字データセットのように8*8=64次元のような形の配列に変換した後、クラスタリングを行いたい。
#環境
Mac OS Catalina
Google Colab
Google Drive(画像データ保存場所)
#ソースコード
feature = []
files = glob.glob("./TACBF/*.tif")
for picture in files:
tmp_img = cv2.imread(picture, cv2.IMREAD_GRAYSCALE+cv2.IMREAD_ANYDEPTH)
img = img_to_array(tmp_img)
feature.append(img)
print("Image number:", len(feature))
feature = np.asarray(feature)
print(feature.shape)
→この結果(1042,)という配列が生成されてしまう
#解決手法?
元の画像を一律の区画で切り取りするなどの加工を施せば、次元を持った配列になるのでしょうか?