回答率: 85.30%

質問するログイン新規登録

トップに関する質問 Pythonクラスタリング方法について

編集履歴

質問編集履歴

4

コード囲み忘れ

2021/11/07 13:20

投稿

スコア1286

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -78,6 +78,7 @@
 #### LinearRegression
+```python
 df4 = df.copy()
 from sklearn.linear_model import LinearRegression
@@ -92,6 +93,7 @@
     print(name, lr.coef_, lr.intercept_)
 sns.scatterplot(x='ta', y='m', hue='cluster', data=df4)
+```
 ![イメージ説明](32a22c50bf19936ab2aa15e0abc9e2e8.png)

3

LinearRegressionを追加

2021/11/07 13:20

投稿

スコア1286

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -76,6 +76,25 @@
 ![イメージ説明](72b2494b8fffbf8c2194355d3d655215.png)
+#### LinearRegression
+df4 = df.copy()
+from sklearn.linear_model import LinearRegression
+lr = LinearRegression()
+lr.fit(df4['ta'].values.reshape(-1, 1), df4['m'].values.reshape(-1, 1))
+pred_y = lr.predict(df4['ta'].values.reshape(-1, 1)).reshape(-1)
+df4['cluster'] = (df4['m'] < pred_y).astype(int)
+for name, dfg in df4.groupby('cluster'):
+    lr.fit(dfg['ta'].values.reshape(-1, 1), dfg['m'].values.reshape(-1, 1))
+    print(name, lr.coef_, lr.intercept_)
+sns.scatterplot(x='ta', y='m', hue='cluster', data=df4)
+![イメージ説明](32a22c50bf19936ab2aa15e0abc9e2e8.png)
 ### 補足情報（FW/ツールのバージョンなど）
 Python3.8

2

df3を追加

2021/11/07 13:19

投稿

スコア1286

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -61,6 +61,8 @@
 #### SpectralClustering
 ```python
+df3 = df.copy()
 from sklearn import cluster
 spectral = cluster.SpectralClustering(n_clusters=2, eigen_solver='arpack', affinity='nearest_neighbors')

1

サンプルデータ追加、GaussianMixtureとSpectralClusteringを追加

2021/11/06 23:02

投稿

スコア1286

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -18,22 +18,62 @@
 ### 該当のソースコード
 ```python
+import pandas as pd
+url = "https://docs.google.com/spreadsheets/d/e/2PACX-1vSA9NhTNG6rcb1BAdVzC2RYgPPCCd0ryo1YconlDj7TK15IAO8rIi3uY9FzRCkXsj48BO4hWtceriKq/pub?gid=0&single=true&output=csv"
+df = pd.read_csv(url)
 sns.scatterplot(x='ta', y='m', data=df)
 ```
 ### 試したこと
+#### KMeans
 ```python
+df1 = df.copy()
 from sklearn.cluster import KMeans
 kmeans = KMeans(n_clusters=2, random_state=0)
-clusters = kmeans.fit(df)
+clusters = kmeans.fit(df1)
-df['cluster'] = clusters.labels_
+df1['cluster'] = clusters.labels_
-sns.scatterplot(x='ta', y='m', hue='cluster', data=df)
+sns.scatterplot(x='ta', y='m', hue='cluster', data=df1)
 ```
+![イメージ説明](e2b2395c12b50c3ac062d8305b8cda6a.png)
+#### GaussianMixture
+```python
+df2 = df.copy()
+from sklearn.mixture import GaussianMixture
+model = GaussianMixture(n_components=2)
+model.fit(df2)
+df2['cluster'] = model.predict(df2)
+sns.scatterplot(x='ta', y='m', hue='cluster', data=df2)
+```
+![イメージ説明](7ee8a9a1129e77289039593222a2f45b.png)
+#### SpectralClustering
+```python
+from sklearn import cluster
+spectral = cluster.SpectralClustering(n_clusters=2, eigen_solver='arpack', affinity='nearest_neighbors')
+clusters = spectral.fit(df3)
+df3['cluster'] = clusters.labels_
+sns.scatterplot(x='ta', y='m', hue='cluster', data=df3)
+```
+![イメージ説明](72b2494b8fffbf8c2194355d3d655215.png)
 ### 補足情報（FW/ツールのバージョンなど）
 Python3.8