質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

617閲覧

pythonを用いた教師なし学習(クラスタリング)について

naots

総合スコア11

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2021/11/05 00:50

編集2021/11/05 04:34

以下のサイトを参考に、自身で用意した画像をクラスタリングするプログラムを作成しています。

scikit-learnで国旗画像をクラスタリングして似ているものを探す

このサイトのままだとfrom skimage import dataの部分で既に用意してある国旗の画像を読み込むだけみたいなので以下のようにしました。
自身で用意した画像が入ってるフォルダはphotoというフォルダ名にしてあります。

python

1import cv2 2import os 3import shutil 4import numpy as np 5from PIL import Image 6from skimage import data 7from sklearn.cluster import KMeans 8 9# 1. 放電画像のサイズをそろえて保存する 10# ./photo 以下に放電画像 11# ./photo 以下に100*100のサイズに変換したjpgを保存 12for path in os.listdir('./photo'): 13 img = Image.open(f'./photo/{path}') 14 img = img.convert('RGB') 15 img_resize = img.resize((100, 100)) 16 img_resize.save(f'./photo/{path}.jpg') 17 18# 2. 3次元配列の画像データを2次元配列のデータに変換 19 20feature = cv2.imread(f'./photo/{path}') 21print(feature.shape) 22feature = feature.reshape(len(feature), -1).astype(np.float64) 23print(feature.shape) 24 25# 3. 学習(2種類のグループにクラスタリングする) 26model = KMeans(n_clusters=2).fit(feature) 27 28# 4. 学習結果のラベル 29labels = model.labels_ 30 31# 5. 学習結果(クラスタリング結果の表示 + ラベルごとにフォルダ分け) 32# ./flag_group 以下に画像を分けて保存する 33for label, path in zip(labels, os.listdir('./photo')): 34 os.makedirs(f"./flag_group/{label}", exist_ok=True) 35 shutil.copyfile(f"./flag_origin/{path.replace('.jpg', '')}", f"./flag_group/{label}/{path.replace('.jpg', '')}") 36 print(label, path)

これにより用意した画像を読み込んで(100, 100, 3)(100, 300)といったように表示され3次元配列の画像データを2次元配列のデータに変換することができました。

ただしこのままだと一枚だけを読み込んでるだけみたいでクラスタリング結果は出ないです。
ここからforを使ってフォルダ内の画像複数枚を読み込めるようにして四次元配列に変換すれば判別結果が出ると考えてますが正直やり方がよくわかってません。

フォルダ内の画像は40枚あり、二通りにクラスタリングしたいです。

ここからどうすれば解決でき、フォルダ内の画像をサイトのようにクラスタリングできるか教えていただきたく思います。

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/11/05 04:29

コードは「コードの挿入」で記入しましょう。
naots

2021/11/05 04:34

ご指摘ありがとうございます。修正いたしました。
HRCo4

2021/11/19 07:55

最終的な出力としては参考にしたサイトと同様にクラス別フォルダに保存ということでいいのでしょうか? 例)40枚の画像を kmeans によりクラスタリング   → フォルダAに18枚、フォルダBに22枚   など
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問