質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.37%

相関関係をクラスタリングしたい

受付中

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,116
退会済みユーザー

退会済みユーザー

動画内のある輝点を指定して、RGBで強度を出しています。その際2つの点の相関関係を出しています。

下図に示した相関関係をk-meansでクラスタリングしたいです。

sk-learn.clusterをインストールしていろいろ試しましたがうまくいかないです。

# -*- coding: utf-8 -*-
import cv2
import matplotlib.pyplot as plt
from numpy import *
import pandas as pd
from scipy import signal
from sklearn.cluster import KMeans

video_path = "water50_2.mkv"
cap = cv2.VideoCapture(video_path)

count = cap.get(cv2.CAP_PROP_FRAME_COUNT)
fps = cap.get(cv2.CAP_PROP_FPS)

numS=raw_input("start frame:  ")
numS=int(numS)

numE=raw_input("end frame:  ")
numE=int(numE)
#numE=count
print(numE)

# 場所を決める
#点滅の場所
x1min=raw_input("点滅1左上のx座標:")
y1min=raw_input("点滅1左上のy座標:")
x1max=raw_input("点滅1右下のx座標:")
y1max=raw_input("点滅1右下のy座標:")

X1min=int(x1min)
Y1min=int(y1min)
X1max=int(x1max)
Y1max=int(y1max)



#ノイズの場所
xnoisemin=raw_input("左上ノイズx座標:")
ynoisemin=raw_input("左上ノイズy座標:")
xnoisemax=raw_input("右下ノイズx座標:")
ynoisemax=raw_input("右下ノイズy座標:")

Xnoisemin=int(xnoisemin)
Ynoisemin=int(ynoisemin)
Xnoisemax=int(xnoisemax)
Ynoisemax=int(ynoisemax)

# フレーム [numS,numE] の範囲で各フレームの [ymin, ymax]x[xmin, xmax] の画素の平均を計算する。
frame_no = arange(numS,numE)
intensity1 = []
intensity2=[]
intensity3=[]
intensitynoise=[]
for i in frame_no:
    # フレーム frame_no を取得する。
    cap.set(cv2.CAP_PROP_POS_FRAMES, i)
    ret, frame = cap.read()
    if not ret:
        print('Failed to grab frame.')
        break
    # 平均画素値を計算する。
    intensity1.append(frame[Y1min:Y1max+1, X1min:X1max+1].mean())
    intensitynoise.append(frame[Ynoisemin:Ynoisemax+1, Xnoisemin:Xnoisemax+1].mean())
    print "frame number ",i

plt.plot(intensity1,intensitynoise,'x')
corr=corrcoef(intensity1,intensitynoise)
a=corr[0,1]
print(a)
pred=KMeans(n_clusters=3).fit(a)
plt.xlabel("left intensity")
plt.ylabel("right intensity")
plt.title("Correlation coefficient:%s"%a)
plt.show()


イメージ説明

例えば以上のコードで実行すると以下のエラーメッセージが出てきます

Traceback (most recent call last):
File "散布図と相関係数.py", line 90, in <module>
pred=KMeans(n_clusters=3).fit(a)
File "/usr/lib/python2.7/dist-packages/sklearn/cluster/k_means_.py", line 887, in fit
X = self._check_fit_data(X)
File "/usr/lib/python2.7/dist-packages/sklearn/cluster/k_means_.py", line 861, in _check_fit_data
X.shape[0], self.n_clusters))
ValueError: n_samples=1 should be >= n_clusters=3


(program exited with code: 1)
Press return to continue

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • nandymak

    2019/09/20 17:32

    何が上手く行かないのでしょうか?具体的に書かれた方が回答が付きやすいと思います。

    キャンセル

回答 2

0

エラーコードの通りではありませんか?

ValueError: n_samples=1 should be >= n_clusters=3

データ数はクラスタリング数より多くなるはずです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

a=corr[0,1]
print(a)
pred=KMeans(n_clusters=3).fit(a)


aが1つだけ取り出した値なので、そもそもおかしいです。
(スカラーなので違うエラーになる気もするけど、どのみち間違っている)


さて、

相関関係をk-meansでクラスタリングしたい

相関行列を距離の遠近とみなしてクラスタリングするのか、単に二次元空間上でやるのかでだいぶ変わってくると思います。

前者であれば、k-meansのアルゴリズム(と実装)は不向きですから、他のアルゴリズムで行ってください。

後者であれば、xとyを特徴量の配列にする、つまり

X = np.stack([intensity1,intensitynoise], axis=1)
km = KMeans(n_clusters=3)
pred = km.fit_predict(X)

みたいな感じで処理すればできるでしょう。あとは適宜プロットしてください(色分けの方法などは調べれば出てきます)。


あと、python2を使っているようですが、今からpython2で新たにコードを書くのはおすすめしません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.37%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る